前言

想想這六年多待在資工系學到很多寶貴的知識,很可惜想上的課程學校都沒有開,
考取證照本身的目的是學習該領域的知識,最後那張紙只是附帶的價值,
這領域有很多有趣的技術可以探討,而且學不完,
比起研究枯燥乏味,除了教授可以討論完,幾乎沒人可以探討,大家都做不同領域的東西,
但沒有這些基礎技術,研究是會做不起來的,
找論文很容易,但要實作出論文的系統架構就不簡單,
很多時候不像AI領域的論文會附帶程式碼,
還是要有底層的技術支援,尤其在人手不足的狀況下,
幾乎所有事都要自己來,基礎技術不足會導致很多事做不來,
尤其是改底層的程式碼時候,需要了解整個程式的流程,
沒有了解程式流程,改了間接導致程式崩潰調,
寫個年度結案報告,只是寫個10幾頁的報告而已,
就遇過一個字都寫不出來,反而還要替學弟收尾的麻煩事,
也反映出其實對這領域知識不熟悉所導致的狀況。

閱讀全文 »

簡介

物體追蹤(Object Tracking)是指在連續的圖像序列中追蹤特定物體的過程。物體追蹤的物體是準確地定位並追蹤物體的位置、形狀和運動。
多物體追蹤(Multi-object Tracking)是指在連續的圖像或視頻序列中同時追蹤多個不同物體的過程。多物體追蹤的物體是同時準確地定位和跟蹤多個物體的位置、形狀和運動。

閱讀全文 »

簡介

影像檢索(Image Retrieval)是指根據用戶提供的查詢條件,從一個大型影像數據庫中檢索出與查詢條件相似或相關的影像的過程。影像檢索旨在根據影像的內容特徵或相似性,實現快速且準確地找到用戶感興趣的影像。

影像檢索的過程可以分為兩個主要步驟:特徵提取和相似性匹配。特徵提取是從影像中提取出具有代表性的特徵,例如顏色、紋理、形狀、結構等。這些特徵可以通過各種計算機視覺和圖像處理技術進行提取。相似性匹配則是通過比較查詢影像的特徵與數據庫中每個影像的特徵,計算它們之間的相似度或距離,並根據相似度排序返回相關的影像。

常見的影像檢索方法包括基於內容的檢索(Content-Based Image Retrieval, CBIR)和基於文字標籤的檢索(Text-Based Image Retrieval, TBIR)。CBIR方法主要依賴影像的內容特徵,如顏色直方圖、紋理特徵、形狀描述子等,進行相似性匹配。TBIR方法則通過對影像進行標籤或描述的方式進行檢索,例如通過用戶提供的關鍵詞或描述進行匹配。

近年來,隨著深度學習技術的發展,基於深度學習的影像檢索方法也得到了廣泛應用。通過使用深度卷積神經網絡(CNN)等深度學習模型,可以從影像中提取出高層次的特徵表示,進一步提高影像檢索的準確性和效果。

影像檢索在許多領域都有重要應用,如圖書館圖像管理、醫學影像分析、視覺監控、社交媒體圖像檢索等。它可以幫助用戶快速找到感興趣的影像,並在大量的影像數據中進行有效的搜索和分析。

閱讀全文 »

前言

(cspnet) (cspnet) (helpers)
cspresnet50 –> _create_cspnet -> build_model_with_cfg

–> CspNet
–> CspModelCfg
–> stem: CspStemCfg –> model_cfg
–> stages: CspStagesCfg

--> create_csp_stem  
--> create_csp_stages  
    -->  _get_stage_fn() --> crossstage
    -->  _get_block_fn() --> Block         
                            --> DarkBlock 
                            --> EdgeBlock 
                            --> BottleneckBlock 
    -->  _get_attn_fn()  --> partial
--> head  
    --> ClassifierHead

–>_init_weights

閱讀全文 »

問題點

有一天伺服器重新開機完,啟動Docker給使用者使用時,
使用者連線進入docker container 環境中出現奇怪的現象,

問題狀況

(1) nvidia-smi無法顯示

1
Failed to initizlize NVML: Unknown Error

(2) torch.cuda.is_available() 回傳False
(3) Let’s use 0 GPUs.

閱讀全文 »
0%