⑴ 百度識圖搜索結果什麼意思
網路搜索新功能搜索結果。「網路識圖是網路圖片搜索近期推出的一項新功能。「世界很復雜,網路更懂你」,常規的圖片搜索,是通過輸入關鍵詞的形式搜索到互聯網上相關的圖片資源,而網路識圖則能實現用戶通過上傳圖片或輸入圖片的url地址,從而搜索到互聯網上與這張圖片相似的其他圖片資源,同時也能找到這張圖片相關的信息。網路(Bai)是擁有強大互聯網基礎的領先AI公司,網路願景是:成為最懂用戶,並能幫助人們成長的全球頂級高科技公司。
⑵ "鍥"璇村ぉ涓:嫻呰皥鍥劇墖鎼滅儲鍔熻兘
闅忕潃360緇煎悎鎼滅儲涓嶆柇鍦板紑鎷撹繘鍙栦箣鍚庯紝鏂頒笂綰誇簡鍥劇墖鎼滅儲鍔熻兘銆傜櫨搴﹀浘鐗囨悳緔㈡瘡澶╃殑鐧懼害棰勮℃祦閲忎負781涓4070錛岃繖榪樹粎浠呭彧鏄鐧懼害鏉ョ殑棰勮℃祦閲忥紝瀹為檯涓婃洿澶氥傛悳緔㈠紩鎿庡競鍦虹殑絝炰簤鏄澶氬厓鍖栫殑錛屼笉浠呬粎鏄鎼滅儲緇撴灉鐨勭珵浜夛紝鍖呮嫭鍥劇墖銆侀煶涔愮瓑鏍忕洰鐨勭珵浜変篃鏃ヨ秼鏃ョ儓銆360鍥劇墖鎼滅儲鎺ㄥ嚭浠ュ悗錛屽浘鐗囨悳緔㈠競鍦轟篃鏄鈥滅櫨瀹墮綈楦b濓紝鐧懼害銆佽胺姝屻佹悳鐙椼佸嵆鍒葷瓑絳夐兘寮濮嬪湪鍥劇墖鎼滅儲棰嗗煙浜夊囨枟鑹熾備笅闈㈢瑪鑰呭氨寮濮嬬敤鈥滃浘鈥濊村ぉ涓嬬殑鍥劇墖鎼滅儲甯傚満銆
1.鐧懼害鍥劇墖(http://image..com)
鐧懼害鍥劇墖鈥滃嚭涓栤濈殑杈冩棭錛岃屼笖鐧懼害涓鍚戝逛簬鑷韜浜у搧閮借祴浜堝緢楂樼殑鏉冮噸錛屾墍浠ヤ竴鑸鍦ㄦ垜浠鎼滅儲鏌愪釜鍥劇墖鐨勭粨鏋滄椂錛岀櫨搴︾浉鍏沖浘鐗囬兘鏄鍑虹幇鍦ㄧ粨鏋滅殑鍓嶅嚑鍚(澶ч儴鍒嗛兘鏄鍓嶄笁)銆傚浘鐗囬栭〉鍑虹幇鐨勬槸鐩稿叧鏍忕洰鐨勪唬琛ㄥ浘鐗囷紝澹佺焊銆佸壋鎰忚捐$瓑錛屽寘鎷涓浜涚儹闂ㄥ浘鐗囥傚湪鎴戜滑鎼滅儲鐩稿叧鍥劇墖鐨勬椂鍊欙紝鏈涓婇潰浼氬嚭鐜頒竴涓綾諱技浜庣櫨搴︾珵浠風殑騫垮憡鎬ц川鍥劇墖錛屼笉榪囪繖涔熺﹀悎浜嗙櫨搴﹀箍鍛婁笉鍦ㄧ殑椋庢牸銆備笅闈㈠垯鏄鐩稿叧鐨勫叧閿璇嶏紝鐒跺悗鎺ヤ笅鏉ュ氨鏄瑕佹悳緔㈢殑鍥劇墖浜嗭紝灝嗛紶鏍囨斁鍦ㄦ兂瑕佺殑鍥劇墖鐨勪綅緗錛屽彲浠ヤ笅杞藉師鍥撅紝涔熷彲浠ョ洿鎺ユ敹鈃忓埌鐧懼害鐩稿唽(榪欎竴鎷涘緢濡)錛岃屼笖鍙浠ョ湅鍒板浘鐗囨潵婧愮殑鍩熷悕浠ュ強鍥劇墖鐨勫昂瀵搞傜偣寮鍥劇墖涔嬪悗錛屽彲浠ュ啀涓嬮潰鐪嬪埌鍥劇墖鐨勬爣棰樹互鍙婂浘鐗囩殑鏉ユ簮鍦板潃錛岀洿鎺ヨ繘鍏ュ師鍥懼湴鍧銆
鍦ㄥ浘鐗囩殑鎼滅儲鍒濆嬮〉闈錛屽乏渚ф湁鍥懼艦鐨勫ぇ灝忓昂瀵搞佺簿紜灝哄搞侀滆壊銆佹牸寮(鍔ㄦ佹垨闈欐)銆佺被鍨嬬瓑鍙渚涚敤鎴烽夋嫨錛岃繖鏍風殑濂藉勬槸鍙浠ヨ╃敤鎴峰仛鍒扮簿鍑嗘悳緔錛岀櫨搴︿笉鎰т負涓鏂囨悳緔㈢殑鈥滃ぇ鍝モ濓紝鍦ㄦ悳緔㈣川閲忎笂榪樻槸姣旇緝鍒頒綅鐨勩
2.璋鋒瓕鍥劇墖(http://images.google.com.hk/)
璋鋒瓕浣滀負涓栫晫涓婃渶澶х殑鎼滅儲寮曟搸錛屽湪瀵逛簬寮曞兼柟闈㈣繕鏄姣旇緝紿佸嚭鐨勶紝鐧懼害銆佹悳鐙楃瓑涔熶竴鐩撮兘鍚戣胺姝屽︿範銆傚湪璋鋒瓕鍥劇墖鎼滅儲鐨勭粨鏋滀笂闈㈡病鏈夊箍鍛婂嚭鐜幫紝涓嬮潰涔熸槸鐩稿叧鐨勫叧閿璇嶏紝鍦ㄥ彸渚у彲浠ヨ劇疆鐩稿叧鍥劇墖鎼滅儲錛屽寘鎷楂樼駭鍥劇墖鎼滅儲璁劇疆銆傞珮綰у浘鐗囨悳緔㈠寘鎷鍏抽敭璇嶃佸湴鍖恆佺綉絝欏煙鍚嶃佷嬌鐢ㄦ潈闄愮瓑鐨勪慨鏀癸紝榪欎簺璁劇疆鍥藉唴鎼滅儲寮曟搸閮藉湪涓瀹氱▼搴︿笂妯′豢璋鋒瓕鍥劇墖鎼滅儲鐨勩
3.鎼滅嫍鍥劇墖鎼滅儲(http://pic.sogou.com/)
濂藉儚鍦ㄥ緢澶氫漢鐨勭溂涓錛屾悳鐙楀湪鎼滅儲寮曟搸鐣屼竴鐩撮兘鎵婕旂潃鈥滄墦閰辨補鈥濈殑瑙掕壊錛屽叾瀹炴悳鐙楀湪寰堝氫駭鍝侀噷闈㈣櫧鐒跺瓨鍦ㄧ潃妯′豢鐨勫珜鐤戱紝浣嗘槸鍦ㄥ壋鏂版柟闈㈣繕鏄姣旇緝紿佸嚭鐨勶紝姣斿傛悳鐙楀浘鐗囨悳緔銆傜洿鎺ュ皢鎼滅嫍璇嗗浘鏀懼湪鎼滅儲妗嗙殑鍙充晶錛屾柟渚跨敤鎴瘋瘑鍒鍥劇墖銆傚湪鎼滅儲緇撴灉閲岄潰錛岀敤鎴峰彲浠ラ夋嫨灝哄搞佺被鍨嬨侀滆壊錛屽湪鎼滅儲閫夋嫨閲岄潰姣旂櫨搴﹀浘鐗囨悳緔㈠拰璋鋒瓕鍥劇墖鎼滅儲閮借佸皯錛屼笉榪囧畠涔熸湁鍙鍙栦箣澶勶紝鍥劇墖鐨勫ぇ灝忕洿鎺ユ樉紺哄湪鍥劇墖鐨勪笅鏂癸紝澶уぇ鏂逛究浜嗚捐¤屼笟鐨勫伐浣滆呫傚湪鎼滅儲緇撴灉閲岄潰涓涓欏甸潰鏈16鍓鍥劇墖錛屾瘮鐧懼害銆佽胺姝岀殑鏁翠釜欏甸潰鏄劇ず瑕佸皯寰堝氾紝涓嶈繃榪欐牱涔熸洿綆媧佺洿瑙備簡錛岀┒絝熷摢涓濂斤紝榪橀渶瑕佺湅鐢ㄦ埛閫夋嫨浜嗐
4.360鍥劇墖鎼滅儲(http://image.so.com/)
360鏃犺轟換浣曚竴嬈句駭鍝佸嚭涓栭兘鏄涓楦f儕浜猴紝姝ゆ℃帹鍑哄浘鐗囨悳緔涔熸槸濡傛わ紝鍗犳嵁鍚勫ぇ浜掕仈緗戞柊闂誨ご鏉°360鍥劇墖鏄鏂頒笂綰跨殑鍥劇墖鎼滅儲錛屽彲浠ヤ緵鐢ㄦ埛閫夋嫨鐨勫彧鑳介夋嫨鍥劇墖澶у皬浠ュ強鏄劇ず鏂瑰紡錛屽嵆浼犵粺鏂瑰紡(鍜屾悳鐙楃被浼)浠ュ強鐎戝竷嫻佹樉紺烘柟寮(綾諱技浜庤胺姝)錛屼笉榪囨牴鎹絎旇呯殑嫻嬭瘯鍙戠幇錛屽洜涓烘槸鏂頒笂綰跨殑鍥劇墖鎼滅儲錛屽湪緇撴灉涓婇潰榪樹笉澶熷畬鍠勶紝鐩稿叧鎬т笉澶с備笉榪囨瘯絝熸槸鏂頒笂綰跨殑浜у搧錛屽氨鍍忔槸寮濮嬬殑360緇煎悎鎼滅儲涓鏍鳳紝360涔熶細鎱㈡參瀹屽杽鐨勶紝鎴戜滑鏈熷緟360鐨勯愭ュ畬鍠勶紝鍥犱負鏃犺烘悳緔㈠紩鎿庝箣闂存垬浜夌殑緇撴灉濡備綍錛屾渶緇堝彈鐩婄殑灝辨槸鎴戜滑鐢ㄦ埛浜嗐
5.鎼滄悳(http://image.soso.com)
鎼滄悳鐨勯愭笎娌¤惤錛屾槸澶у舵湁鐩鍏辯澒鐨勶紝涓嶇℃槸涓嶆槸鑵捐澶辮觸鐨勪竴嬈句駭鍝侊紝浣嗘槸鑵捐鐨勭敤鎴烽亶甯冧腑鍗庡ぇ鍦幫紝濡傛灉鑵捐鑳藉儚鐧懼害涓鏍風◢寰鍒╃敤涓鐐規妧宸у湪鍦ㄨ嚜宸辯殑浜у搧涓婇潰錛屾悳鎼滅殑褰卞搷鍔涘苟涓嶈佸緱姣旂櫨搴﹀急澶氬皯銆傚湪鎼滄悳鍥劇墖鎼滅儲緇撴灉閲岋紝鐢ㄦ埛鍙浠ヨ劇疆澶у皬銆侀滆壊銆佹櫘閫氬浘鐗囨垨鑰匭Q琛ㄦ儏緇欑瓑錛岃屼笖鍦ㄥ浘鐗囩殑涓嬫柟鐩存帴鍙浠ョ偣鍑葷浉浼肩粨鏋滐紝榪欎竴鐐規瘮鐧懼害鍜屾悳鐙楅兘瑕佸厛榪涗簡銆
6.鍗沖埢鍥劇墖(http://image.jike.com/)
鍗沖埢鎼滅儲榪欎袱騫寸殑鍙戝睍鍔垮ご姣旇緝鐚涳紝鍏跺浘鐗囨悳緔涔熸槸姣旇緝寮烘倣鐨勶紝鐗瑰埆鏄渚濋潬鍏舵洕鍏夊彴錛岀綉絝欐祦閲忚繕鏄寰堝ぇ鐨勶紝鑰屽浘鐗囨悳緔涔熶笉浼氳惤鍚庛傜敤鎴瘋兘閫夋嫨澶у皬銆侀滆壊銆佸浘鐗囩被鍨嬩互鍙婇勮堟柟寮忥紝涓嶈繃鍦ㄥ浘鐗囨悳緔㈢殑鏈夋墊寕鏈夊箍鍛婃秷鎮錛岃繖涓鐐瑰湪鐢ㄦ埛浣撻獙鏂歸潰灝變笉濂戒簡銆
鍥劇墖鎼滅儲鏂歸潰榪樻湁bing銆侀泤鉶庣瓑錛屾垜灝變笉鍦ㄨ繖閲屼竴涓鍒嗘瀽浜嗭紝濡傛灉鎯充簡瑙g殑璇濓紝璇風湅銆婃祬璋堝浗鍐呭嶮澶ф悳緔㈠紩鎿庛嬨
涓婇潰灝辨槸鐩鍓嶆瘮杈冧富嫻佺殑鍑犲ぇ鍥劇墖鎼滅儲浜嗭紝鍏朵腑鐧懼害鍥劇墖鐨勭櫨搴﹂勮℃祦閲忎負781涓4070錛岃胺姝岀殑鐧懼害棰勮℃祦閲忎負3626錛屾悳鐙楃殑涓8479錛屾悳鎼滅殑涓3461錛屽嵆鍒葷殑涓417錛屼粎浠呭崟浠庣珯闀誇箣瀹剁殑涓浜涢勮℃暟鎹鏉ョ湅錛岀櫨搴︽槸鍥劇墖鎼滅儲鐢ㄦ埛鏈澶氱殑錛屽綋鐒惰繖涓鏁版嵁鍙鑳戒綔涓哄弬鑰冩暟鎹錛屼絾鏄涔熷彲浠ュ弽鏄犲嚭鐧懼害鍥劇墖渚濋潬鍏剁櫨搴﹁嚜韜鐨勯湼涓誨湴浣嶏紝浣跨敤鍥劇墖鎼滅儲鐨勭敤鎴鋒渶澶氥
絎旇呭埄鐢ㄢ滅埍鎯呪濆幓鍚勪釜緗戠珯鐨勬悳緔㈢粨鏋滃彂鐜幫紝鐧懼害鎵懼埌鐩稿叧鍥劇墖綰94500000寮狅紝璋鋒瓕鎵懼埌綰 82300000 鏉$粨鏋滐紝鎼滅嫍鎵懼埌綰20380351緇勫浘鐗囷紝360鎵懼埌鐩稿叧鍥劇墖綰 7520000 寮狅紝鎼滄悳鎼滅儲鍒扮害51510636欏瑰寘鍚緇勫浘鐨勭粨鏋滐紝鍗沖埢鎼滅儲鏈鍙戠幇鐩稿叧鍥劇墖鏁扮洰緇撴灉銆備粠鍥劇墖鏀跺綍鏁伴噺鏂歸潰鏄庢樉鐧懼害鐙棰嗛庨獨錛岃胺姝岀揣闅忓叾鍚庯紝鑰屽垵鍑鴻寘搴愮殑360榪樻槸璧拌嚜宸辯殑鑰佽礬錛屽嚭涓栧氨瑕佸彈鎸鎶橈紝鏁伴噺涓婃槑鏄句笉濡傚叾浣欑殑鍥劇墖鎼滅儲銆
鍦ㄧ敤鎴風殑閫夋嫨鎬т笂闈錛岄兘鐩稿樊鏃犲嚑錛屽浘鐗囧ぇ灝忋侀滆壊銆佹牸寮忋佺被鍨嬬瓑閮借兘渚涚敤鎴烽夋嫨錛屽湪榪欎竴鏂歸潰鍋氱殑鏈鍒頒綅鐨勫氨鏄璋鋒瓕鍥劇墖鎼滅儲浜嗭紝鍩烘湰涓婂浗鍐呯殑鍥劇墖鎼滅儲閮藉湪妯′豢璋鋒瓕錛屾墍浠ュ畠鐨勫姛鑳芥槸鏈澶氱殑銆
鍦ㄧ敤鎴蜂綋楠屼笂錛屾牴鎹涓浜哄枩濂芥潵璇磋胺姝屽拰鎼滄悳鐨勯兘鏄涓嶉敊鐨勶紝鐧懼害銆佸嵆鍙鎼滅儲鏃犲瓟涓嶅叆鐨勫箍鍛婏紝鉶界劧璇存湁騫垮憡鏄鍙浠ョ殑錛屼絾鏄瀵逛簬鐢ㄦ埛鏉ヨ達紝濡傛灉鏉ョ湅涓浜涚簿緹庣殑鍥劇墖閮借佸彈鍒板箍鍛婄殑渚墊壈錛岃繖灝辨槸閬緗浜嗐
鍦ㄧ簿鍑嗘ф柟闈錛屾棤鐤戣繕鏄鐧懼害鍜岃胺姝岋紝鍦ㄥ浘鐗囨敹褰曟柟闈㈡槸鍒濆嚭鑼呭簮鐨360鎵涓嶈兘姣旂殑錛岀櫨搴﹀拰璋鋒瓕鐨嗏滃唴鍔熸繁鍘氣濓紝綺懼噯鎬ц繕鏄寰堥珮鐨勶紝涓嶈繃鐧懼害鍋跺皵浼氬嚭鐜頒竴浜涙晱鎰熸х殑鍥劇墖錛岃繖涓鏄浠ュ悗鐧懼害鍥劇墖鎼滅儲闇瑕佹敼姝g殑錛岃胺姝屽湪榪欐柟闈㈠凡緇忓仛鍑轟簡琛ㄧ巼錛屽湪鎼滅儲緇撴灉紱佹㈠嚭鐜版晱鎰熸у浘鐗囷紝鎴戜滑鍥藉唴鐨勬悳緔㈠紩鎿庣洰鍓嶈繕娌℃湁鍙戠幇鏈夎繖縐嶅0鏄庛
鍥劇墖鎼滅儲甯傚満瓚婃潵瓚婂氥佹潅銆佷貢錛岀敤鎴風殑閫夋嫨涔熶細瓚婃潵瓚婂氾紝鍙鏈夋渶絎﹀悎鐢ㄦ埛浣跨敤涔犳儻鐨勬墠浼氱瑧鍒版渶鍚庯紝鍥劇墖鐩告瘮杈冩枃瀛楁潵璇寸粰鐢ㄦ埛鐨勫啿鍑誨姏鏇村ぇ錛屾墍浠ヤ換浣曚竴涓鎼滅儲寮曟搸閮借垗涓嶅緱鎵旀帀榪欏潡鈥滆倝鈥濓紝浣嗘槸瑕佸湪榪欐柟闈㈠仛濂姐佸仛綺撅紝灝遍渶瑕佸悇澶ф悳緔㈠紩鎿庣殑鍔鍔涗簡錛屼綔涓虹敤鎴鋒垜浠鏈熷緟鎼滅儲寮曟搸鍦ㄥ浘鐗囨悳緔涓婇潰鐨勫彉鍖栥
鏂囩珷鐢http://www.89guo.com/index.php/archives/89渚涚匡紝杞杞借瘋存槑銆
⑶ 用圖片識別搜索引擎(如百度識圖、騰訊優圖)識別個人照片,會不會泄露個人隱私也就是說圖片會不會上傳
會在一定范圍內泄露個人隱私。圖片也會上傳。
原因:圖片識別的基本原理是"感知哈希演算法"(Perceptual hash algorithm),它需要先抓取你的圖片信息,然後根據圖片信息生成一個獨一無二的字元串,然後再去匹配類似接近的字元串。在抓取和匹配的過程中,你的個人信息其實已經上傳。
(3)百度搜索圖片的科學性擴展閱讀
圖像識別,是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對象的技術,是應用深度學習演算法的一種實踐應用。
現階段圖像識別技術一般分為人臉識別與商品識別,人臉識別主要運用在安全檢查、身份核驗與移動支付中;商品識別主要運用在商品流通過程中,特別是無人貨架、智能零售櫃等無人零售領域
圖像的傳統識別流程分為四個步驟:圖像採集→圖像預處理→特徵提取→圖像識別。圖像識別軟體國外代表的有康耐視等,國內代表的有圖智能、海深科技等。另外在地理學中指將遙感圖像進行分類的技術。
⑷ 為什麼百度搜索結果描述前有圖片
網路搜索結果描述前有圖片是為了方便用戶瀏覽,簡而言之,就是為了更好的用戶體驗。圖片來自於該網站內的圖片,是網路根據用戶偏好而隨機抓取的,可能是網站的banner圖片,也可能是產品圖片或活動圖片。
搜索結果頁是指搜索引擎對某個搜索請求反饋的結果頁面。通常一個典型的搜索結果頁麵包含了一個搜索結果的列表,大多數網站都有自己的搜索功能,而實用這個搜索功能就會出現一個搜索結果頁來展示符合搜索要求的結果。
⑸ 這樣在百度搜索出來帶圖片的SEO怎麼做出來的
在網路搜索出來帶圖片的SEO需要具備以下要求:
1、圖片大小比例:點擊索引圖片發現,索引裡面圖片的大小統一是121*75px的尺寸,審查元素代碼,圖片小於121*75px的尺寸,不會被抓去,因為太小了影響圖片清晰度。同時圖片的比例要盡量符合121:75,這樣出現的幾率就會大很多。
2、文章的快照時間:網路很少會把一張N個月前的圖片放到搜索結果中去,絕大部分的左側圖片快照都是12月份以後的,據此可以推測頁面的時效性佔了一定的關系。通常都是一個月之內的圖片會出現在搜索結果中。
3、具有一定權重:要具有一定權重值,是指在這個關鍵詞上具有一定的權重級別,具有唯一性的,這個權重值不高。大家可以嘗試搜索下自身網站的品牌詞,因為品牌詞是具有唯一性的。
(5)百度搜索圖片的科學性擴展閱讀:
SEO優化注意事項:
1、關鍵詞:關鍵詞的選擇是SEO重要的一步,經常會看見有的網站有幾十個關鍵詞的,這是非常錯誤的做法,建議利用網路指數,選擇指數在300以內的,關鍵字的個數最好是3-5個。
關鍵字的選擇與分析對一個網站未來的發展與走向也起到了至關重要的作用,我們在選擇時,要盡量選擇自己熟悉和喜歡的行來做來,這樣既可以方面便我們選擇關鍵字,也可以讓我們充滿鬥志與激情,一個好的關鍵字會為我們帶也數以萬計甚至是十萬計的收錄量的。
2、標題黨:很多新手網站標題(title)將近百字,一眼看去,產品幾乎是無所不有的,給人的感覺像是一個雜貨鋪似的,建議先做單一產品,便於優化。其次標題最好保持在28字以內。關鍵字可以堆砌,但要合理。
3、網站程序:網站的前期工作做好了之後,接下來就要考慮怎麼選擇網站的程序,如果做得是門戶網站,建議使用DEDE、論壇DZ等之類的,可以先建立一個博客為之後的seo做准備,博客的可以選用WP程序的,現在網站現成的網站模版很多,可以找一些來參考一下。
⑹ 百度圖片搜索引擎原理是如何實現的
圖片搜索的原理有三個步驟
1. 將目標圖片進行特徵提取,描述圖像的演算法很多,用的比較多的是:SIFT描述子,指紋演算法函數,bundling features演算法,hash function(散列函數)等。也可以根據不同的圖像,設計不同的演算法,比如圖像局部N階矩的方法提取圖像特徵。
2. 將圖像特徵信息進行編碼,並將海量圖像編碼做查找表。對於目標圖像,可以對解析度較大的圖像進行降采樣,減少運算量後在進行圖像特徵提取和編碼處理。
3. 相似度匹配運算:利用目標圖像的編碼值,在圖像搜索引擎中的圖像資料庫進行全局或是局部的相似度計算;根據所需要的魯棒性,設定閾值,然後將相似度高的圖片預保留下來;最後應該還有一步篩選最佳匹配圖片,這個應該還是用到特徵檢測演算法。
其中每個步驟都有很多演算法研究,圍繞數學,統計學,圖像編碼,信號處理等理論進行研究。
根據Neal Krawetz博士的解釋,原理非常簡單易懂。我們可以用一個快速演算法,就達到基本的效果。
這里的關鍵技術叫做"感知哈希演算法"(Perceptual hash algorithm),它的作用是對每張圖片生成一個"指紋"(fingerprint)字元串,然後比較不同圖片的指紋。結果越接近,就說明圖片越相似。下面是一個最簡單的實現:
第一步,縮小尺寸。
將圖片縮小到8x8的尺寸,總共64個像素。這一步的作用是去除圖片的細節,只保留結構、明暗等基本信息,摒棄不同尺寸、比例帶來的圖片差異。
第二步,簡化色彩。
將縮小後的圖片,轉為64級灰度。也就是說,所有像素點總共只有64種顏色。
第三步,計算平均值。
計算所有64個像素的灰度平均值。
第四步,比較像素的灰度。
將每個像素的灰度,與平均值進行比較。大於或等於平均值,記為1;小於平均值,記為0。
第五步,計算哈希值。
將上一步的比較結果,組合在一起,就構成了一個64位的整數,這就是這張圖片的指紋。組合的次序並不重要,只要保證所有圖片都採用同樣次序就行了。
得到指紋以後,就可以對比不同的圖片,看看64位中有多少位是不一樣的。在理論上,這等同於計算"漢明距離"(Hammingdistance)。如果不相同的數據位不超過5,就說明兩張圖片很相似;如果大於10,就說明這是兩張不同的圖片。
具體的代碼實現,可以參見Wote用python語言寫的imgHash.py。代碼很短,只有53行。使用的時候,第一個參數是基準圖片,第二個參數是用來比較的其他圖片所在的目錄,返回結果是兩張圖片之間不相同的數據位數量(漢明距離)。
這種演算法的優點是簡單快速,不受圖片大小縮放的影響,缺點是圖片的內容不能變更。如果在圖片上加幾個文字,它就認不出來了。所以,它的最佳用途是根據縮略圖,找出原圖。
實際應用中,往往採用更強大的pHash演算法和SIFT演算法,它們能夠識別圖片的變形。只要變形程度不超過25%,它們就能匹配原圖。這些演算法雖然更復雜,但是原理與上面的簡便演算法是一樣的,就是先將圖片轉化成Hash字元串,然後再進行比較。