第(3/3)頁 在meta那邊的開發(fā)部門找個兩個人,在學(xué)了倉頡語言之后,只花了一天時間就根據(jù)這個算法,做出了一個程序掛載到meta社區(qū)的上傳功能。 畢竟對于這些開發(fā)人員來說,是有了題目和解題步驟,還提供了筆,算出結(jié)果是在不難。 這個程序很簡單,meta這邊的工作人員收集大量的違規(guī)圖片,再把這些圖片上的違規(guī)內(nèi)容摳出來作為樣本庫,這個工作會一直持續(xù)下去,完善樣本庫。 用戶上傳的圖片會先進入到這個程序,和樣本庫進行對比,設(shè)定一個閾值,比如相似度達到80%以上就可以直接過濾了,告訴用戶這圖我不要。 相似度達到60%左右的才轉(zhuǎn)人工審核,而低于60%的直接放行。 隨著樣本庫的完善,這個程序?qū)絹碓綔?zhǔn)確,當(dāng)然,消耗的計算資源也會越來越多。 程序經(jīng)過兩天的測試,人工審核工作量大幅度下降。 王正扭頭把這程序再發(fā)給國內(nèi),小云書上直接掛載就好了。 接下來,迫切需求的還有圖片壓縮技術(shù)。 一般情況下,用數(shù)碼相機拍出來的照片是raw格式圖片,這是原生圖片,沒有經(jīng)過任何壓縮,照片質(zhì)量最好。 但是這種圖片動輒幾十mb甚至上百mb,要是一不小心多拍幾張,sd卡就塞不下了。 而且要是用這種格式去做動畫或者電影,一秒鐘都得1個gb沒哪個人受得了這個。 所以用數(shù)碼相機通常拍攝圖片,都是直接把raw格式壓縮成jpg格式,就是我們用相機、手機等設(shè)備拍攝后所看到的圖片,除非手動調(diào)整,否則99%默認都是jpg格式。 jpg格式是一種有損壓縮技術(shù),就是說它雖然體積小,但是畫面質(zhì)量會有損失。 而且要說體積小,單張照片也有3mb左右,根據(jù)相機的畫幅有所變動。 meta社區(qū)一次最多允許上傳9張照片,這些照片的存儲要占用30mb左右的空間,如果再做個數(shù)據(jù)容災(zāi)備份,就奔著60mb去了。 隨著用戶量越來越大,未來還要開通音頻、視頻服務(wù),meta可能要建上百個數(shù)據(jù)中心才能滿足圖片存儲的需求。 再有一個原因,30多mb的圖片再上傳到網(wǎng)頁上,流量占用大,網(wǎng)頁打開速度慢,也會影響用戶的體驗和meta的成本。 多圖殺貓,就是這么來的。 唯一的解決辦法就是,將jpg再次壓縮,還要盡可能的保證質(zhì)量,提高存儲效率和傳輸效率,以此避免客戶看到的圖片全都是糊的。 但是具體怎么做?萬事不決還是要去找u盤。 第(3/3)頁