前不久有朋友問我現(xiàn)在大多時(shí)間看什么網(wǎng)站,仔細(xì)想想之后,發(fā)現(xiàn)自己的讀網(wǎng)行為完全沒有規(guī)律。以前基本看門戶站和幾個(gè)圈子的BBS,現(xiàn)在大部分時(shí)間看訂閱的RSS,一是懶了,再是事多,只想閱讀自己愿意去信任的信息源,那些熱鬧的門戶和社區(qū),充滿了真假莫辯的“營(yíng)銷”內(nèi)容?! ?/P>
從很久以前開始,我有一個(gè)夢(mèng)想,那是關(guān)于一種智能信息處理的技術(shù),它能夠日以繼夜地在網(wǎng)絡(luò)上搜集所有我關(guān)心的信息,然后分類。同時(shí)學(xué)習(xí)我的閱讀 習(xí)慣,給收集回來的信息做輕重緩急的標(biāo)簽處理,最緊急的甚至能夠打手機(jī)把我叫醒。當(dāng)然,它要智能得知道那個(gè)打電話的時(shí)間不會(huì)導(dǎo)致我摔手機(jī),或者就是這個(gè)智 能已經(jīng)進(jìn)化到了能夠在跟手機(jī)有仇的情況下故意嫁禍。
數(shù)據(jù)挖掘研究院
智能信息處理的重要性人盡皆知,現(xiàn)在不但信息冗余太厲害,再者,被“大客戶”干預(yù)的內(nèi)容不少,道德底線在地核之下的搜索結(jié)果也更多,沒有經(jīng)過處 理就洶涌過來的信息不但沒有用,反而成為負(fù)擔(dān)。而在海量信息中進(jìn)行有效篩選,總能避開暗礁,釣起蘇眉,肯定不是人干的活。誰干?我覺得GOOGLE目前最 有希望往這個(gè)方向進(jìn)化,而且有可能解決全球準(zhǔn)則和部分特殊國(guó)情的某些矛盾,比如私人化的信息不是公共信息,不需要按照“大客戶”的要求進(jìn)行屏蔽,也不會(huì)產(chǎn) 生相關(guān)的風(fēng)險(xiǎn)。 數(shù)據(jù)挖掘交友
最好不要讓GOOGLE的人認(rèn)識(shí)你,他們出現(xiàn)在任何SNS的好友推薦里,也千萬不要加。這樣的話就可用掩耳盜鈴的心態(tài)登錄ID后再使用他們家的 服務(wù),比如搜索,讓GOOGLE保留搜索歷史,同時(shí)在GMAIL里面收一些關(guān)鍵詞郵件,盡量教會(huì)GOOGLE明白平時(shí)你都關(guān)心些什么。接著大膽在 READER里面訂閱你手工能夠找到的心水RSS,比如AV指南,性感美女之類的……其實(shí)我不是G粉,舉他為例僅僅有兩個(gè)可憐的原因,一個(gè)是目前只有他流 露出這種欲望,作出一股貼身服務(wù)的姿態(tài),想著讓我們盡量把隱私數(shù)據(jù)給他,根本沒有第二個(gè)類似可選的;二是好歹他有不作惡的道德承諾,其他企業(yè)有誰做出類似 的承諾嗎?承諾不一定有用,可是有總比沒有強(qiáng)。這從另外一個(gè)角度說明了為什么我們都很容易被騙,到底是壞人太多,一個(gè)自稱的不作惡就能打動(dòng)我們。 數(shù)據(jù)挖掘工具
事實(shí)上,盡管GOOGLE已經(jīng)收集和分析了我那么多行為,只停留在為收集而收集,不但還沒有智能,連一般的數(shù)據(jù)挖掘都顯得很傻瓜,希望其進(jìn)化第 一步,在READER里給我推薦的RSS能否更加靠譜些?現(xiàn)在推薦過來的,基本上同義反復(fù),配對(duì)下關(guān)鍵詞或者標(biāo)簽就塞過來,我要的就是有人幫我選,而不是 來添亂的好不好。比如,要根據(jù)我的高尚品味,提供更清涼更漂亮的圖片視頻什么的,這可以在我不斷地取舍之后,逐步認(rèn)識(shí)到我的審美高度啊。其實(shí),如果結(jié)合搜 索所用關(guān)鍵詞和GMAIL,READER可以做得更好,莫非不同業(yè)務(wù)之間的數(shù)據(jù)共享因?yàn)橛写蠊静《霾坏剑?nbsp;
數(shù)據(jù)挖掘交友
當(dāng)然,現(xiàn)在所有這些可能的處理,只是很初級(jí)的數(shù)據(jù)挖掘,跟智能代理一點(diǎn)邊都掛不上。人工智能,目前畢竟屬于科學(xué)研究范疇而并非商業(yè)應(yīng)用范疇,把 希望寄托在一個(gè)公司上面應(yīng)該還是不靠譜。這里我所指的科學(xué)研究范疇意思是專門搞不靠譜的事情,商業(yè)應(yīng)用就是可以計(jì)劃能夠賺錢的差事。想到這里,一聲嘆息。
數(shù)據(jù)挖掘?qū)嶒?yàn)室
突然想起朋友講過的一個(gè)故事,說遇到某個(gè)老一輩程序員,想拍下馬屁就稱呼對(duì)方叫做第一代程序員,結(jié)果對(duì)方非常不爽,他堅(jiān)持說自己是科學(xué)家。
人工智能的算法,至今還是難題,我想,有能力并愿意面對(duì)這個(gè)困境試圖去解決的,就是真正的科學(xué)家。更愿意面對(duì)人民幣的話,還是做一個(gè)程序員為 妙,哪怕只是做一個(gè)火星文輸入法,現(xiàn)在也有人使用的,搞不好還能發(fā)展成木馬什么的,就算危機(jī)來了沒事干,還可以去盜些各種各樣的號(hào)來賣一賣。