Learning Rate Range Test
lr_find() 使用教學
lr_find() 是一種自動尋找最佳學習率的工具,原理來自
Leslie Smith 的 Learning Rate Range Test。
.rst 檔案是 reStructuredText
的縮寫。它是一種輕量級標記語言(Lightweight markup
language)的純文字檔案,概念上與 Markdown(.md)非常類似。
Upgrading to a new Ubuntu Long Term Support (LTS) release like 26.04 is a straightforward process, but it is important to take a few precautions before starting.
Here is the step-by-step guide to upgrading your system to Ubuntu 26.04 via the command line, which is generally the most reliable method.
SLAM (Simultaneous Localization and Mapping,同步定位與地圖構建) 是機器人學與計算機視覺領域中的核心技術。
簡單來說,SLAM 要解決的是一個「先有雞還是先有蛋」的問題: * 定位 (Localization): 如果我有一張地圖,我能知道我在哪裡。 * 建圖 (Mapping): 如果我知道我在哪裡,我能畫出周圍的地圖。 * SLAM: 當我身處一個完全陌生的環境時,我要同時完成「畫地圖」和「確定自己的位置」。
世界模型 (World Models)是人工智慧領域中一個極具野心的概念,它試圖讓 AI 不僅僅是「反應」輸入的資料,而是能像人類一樣,「理解」物理世界的運作規律,並在腦中「模擬」未來的發展。
裝置端訓練 (On-Device Training, ODT) 是行動端機器學習的下一個演進階段。相較於傳統的「雲端訓練、裝置推理」,裝置端訓練允許模型在用戶的手機或嵌入式設備上直接進行學習與更新。
模型量化(Model Quantization)是邊緣計算(Edge AI)和行動裝置機器學習中極為核心的優化技術。
簡單來說,量化就是「將神經網路中的高精度數字(通常是 32 位元浮點數)轉換為低精度數字(例如 8 位元整數)」的過程。
這就像是把一張高解析度、全彩的圖片,壓縮成低解析度、只有 256 色的圖片。雖然畫質(精確度)會有一點點損失,但檔案大小會大幅縮小,載入速度也會變快很多。
裝置端推理 (On-device Inference) 常被使用於兩大主流機器學習框架中:TensorFlow Lite (TFLite) 與 ONNX Runtime。
這份研究論文介紹了 CoMViT,這是一種專為資源受限的醫學影像分析所設計的輕量化視覺轉換器(Vision Transformer)架構。傳統模型在小型醫療數據集上常面臨計算需求過高與過擬合的挑戰,而此架構透過卷積標記器(convolutional tokenizer)、對角遮罩與動態溫度縮放等技術,顯著提升了局部空間特徵的捕捉能力。實驗結果顯示,該模型僅需約 450 萬個參數,就能在包含 12 種不同模態的 MedMNIST 基準測試中,達到與大型模型相提並論甚至更優異的準確度。此外,透過 Grad-CAM 可視化分析證實,該模型能精確聚焦於具備臨床意義的病灶區域,兼具解釋性與運算效率。這項成果證明了優化架構設計而非單純擴大規模,才是開發實用醫療人工智慧系統的關鍵。
YOLO26 的關鍵架構增強功能: (a) 移除分佈焦點損失 (Distribution Focal Loss, DFL) 簡化了邊界框迴歸,提升了效率與匯出相容性。 (b) 端到端無 NMS 推論消除了後處理瓶頸,實現更快速、更簡單的部署。 (c) ProgLoss 和 STAL 增強了訓練穩定性,並顯著提高了小物件偵測的準確度。 (d) MuSGD 最佳化器結合了 SGD 和 Muon 的優勢,在訓練中實現更快速、更穩定的收斂。 (e) YOLO26 的推論速度比 YOLOv11 和 YOLOv12 更快,在 nano 模式下,CPU 推論時間最多可減少 43%。