听书阁_书友最值得收藏的免费小说阅读网

第57章 太diao了吧-《重生之AI教父》


    第(1/3)頁

    也是了,孟繁岐恍然明悟。

    檢測任務的數(shù)據(jù)集收集和標注的成本更高,這也是為什么孟繁岐奪冠的大賽,分類圖片一千多萬張,檢測圖片才幾萬張。

    目前所有的這些內容全部都是人工去標注。

    一張分類圖片,只需要標注一個標簽,它是什么即可。

    而標注一張檢測圖片,經常需要在上面添加數(shù)個,甚至十數(shù)個檢測框,需要細致到具體輪廓,然后再添加類別。

    標注的成本,自然是十數(shù)倍的差別。

    為圖片添加選框和標簽的工具也不完善,操作繁瑣,就更使得其緩慢。

    截止到現(xiàn)在,深度神經網絡為基礎的檢測算法還有展現(xiàn)出什么實際的商業(yè)價值,還停留在實驗室研究階段,實際上并沒有得到這些大公司足夠的重視。

    目前商業(yè)用的檢測算法,還是傳統(tǒng)技術為主,并不需要訓練數(shù)據(jù),而是通過人工設計的濾波器去提取特征。

    孟繁岐演示使用的公開voc檢測數(shù)據(jù)一共就幾萬張,相比日后動輒幾千億的模型參數(shù)量,幾個t的數(shù)據(jù)量,這個規(guī)模有點像過家家。

    此時此刻,就白度內部而言,李彥弘這個深度學習研究院,也只在私下積累了不到十倍的私有數(shù)據(jù)量,也就差不多二三十萬張。

    對于白度來說,基于這個本錢,想直接像后來的chatgpt一樣,提供一個人人可用的ai智能,那還差了十萬八千里。

    “李彥弘開這個技術發(fā)布會的意圖,其實就是伸手要數(shù)據(jù)。”孟繁岐稍一思索就想明白了,“通過展現(xiàn)這種神奇的效果,誘惑需要工業(yè)檢測的廠商,需要醫(yī)療圖像檢測的機構,想要開發(fā)自動駕駛的車企。”

    “你們給我數(shù)據(jù),我就能幫你們做這個功能。”

    李彥弘這是想趁這個技術優(yōu)勢,收割一大波免費的數(shù)據(jù)啊!

    這小算盤,打得太精了。孟繁岐心中嘖道。

    這個時間段,這種圖片數(shù)據(jù)的價值還沒有得到廣泛的理解,借助檢測技術的飛躍,白度收割這些圖片起來就像噶韭菜。

    再過一段時間,就沒那么容易白賺了。
    第(1/3)頁