現代程式設計 101

透過實作教學、真實範例與最佳實務,學習涵蓋 Python、C++ 與 JavaScript 的現代程式設計基礎。

C++ 與 Rust 之間的記憶體安全討論,已經成為軟體工程領域中最熱門的話題之一。政府機構紛紛表態、研討會專題演講層出不窮,雙方陣營各持己見、立場鮮明。 讓我先把話說在前頭:Rust 是一門非常優秀的語言。 它的所有權模型和借用檢查器確實具有創新性,能在編譯期就攔截一整類的錯誤。如果你正在啟動一個新專案,且 Rust 適合你的團隊和生態系統,那絕對是個好選擇。 與此同時,C++ 仍然是全球最講究效能的軟體之基石:作業系統核心、遊戲引擎、瀏覽器、資料庫、金融系統。這絕非巧合,也不是因為那些團隊沒聽說過 Rust。 這篇文章想探討的,是在這場論戰中經常被忽略的一個重點:現代 C++(C++11 及之後的版本)提供了強大的工具來撰寫記憶...

Tiny BPE Trainer 介紹如今,從 GPT 到 RoBERTa,大多數現代 NLP 模型都依賴於使用位元組對編碼 (BPE) 的子詞標記化。但是,如果您想用純 C++ 訓練自己的詞彙表,該怎麼辦? 認識Tiny BPE Trainer——一款速度超快、僅包含頭檔的 BPE 訓練器,採用現代 C++ 17/20 編寫,零依賴,完全支援UTF-8 編碼,並相容於 HuggingFace 的輸出(vocab.txt、merges.txt)。 為什麼要再增加一個 BPE Trainer?因為現有的方案通常: 僅支援 Python,運行時依賴性很強(Rust、Protobuf 等) 不易嵌入到 C++ 應用程式 不注重速度、簡潔...

現代文本分詞器簡介BERT、DistilBERT 和其他基於 Transformer 的架構等現代自然語言處理 (NLP) 模型高度依賴有效的分詞。但 C++ 開發者經常面臨許多限制,例如依賴項過多、Unicode 支援不佳,或與基於詞彙的編碼器缺乏相容性。 正因如此,我創建了 現代文本分詞器——一款速度超快、僅使用標頭文件的 C++ 分詞器,它支援 UTF-8 編碼、零依賴,並且開箱即用,機器學習就緒。 它的獨特之處? 零依賴 – 無需 Boost、無需 ICU、無需外部函式庫。 UTF-8 安全性 – 可正確處理多語言文字、表情符號和多位元組字元。 僅使用標頭檔案 – 將其新增至您的專案中即可使用。 詞彙編碼 –...

踏上編程世界的旅程既令人興奮又勢不可擋。 有無數的編程語言可供選擇,選擇符合您的目標和願望的正確語言至關重要。 在本文中,我們將探討在選擇您的第一種編程語言時要考慮的因素,並提供流行語言的代碼示例以幫助說明它們之間的差異。 選擇編程語言時要考慮的因素 職業目標:如果您打算從事軟件開發工作,則必須研究您感興趣的行業需要哪些編程語言。 學習曲線:有些語言的學習曲線比其他語言更陡峭。 對於初學者來說,從一種學習曲線平緩且易於理解的語言開始是有益的。 社區和支持:一個龐大、活躍的社區可以更輕鬆地找到常見問題的解決方案和學習最佳實踐。 考慮具有大量文檔和支持資源的語言。 平台兼容性:確保您選擇的語言與您打算定位的平台兼容,例如網絡、移動或桌面...