發新話題
打印

[新聞] ChatGPT+必應,微硬要掀翻Google搜尋的鐵王座

ChatGPT+必應,微硬要掀翻Google搜尋的鐵王座

去年年末,聊天機器人ChatGPT如同一陣旋風般席捲全網。而“文能提筆做文章,武能動手修BUG”的ChatGPT,更是幾乎可以做任何事情,也使得AI文字生成彷彿第一次擁有了“靈魂”。得益於ChatGPT的優秀素質,在其上線短短5天後,Open AI首席執行官Sam Altman就在社交媒體披露其使用者量已突破100萬,也為AIGC再添了一把火。

作為Open AI背後的投資者,微硬方面似乎也看上了ChatGPT。近日來自海外科技媒體The Information的消息顯示,有知情人士透露,微硬方面正準備在其必應(Bing)搜尋引擎中加入OpenAI的人工智慧語言模型ChatGPT,以吸引競爭對手Google搜尋的使用者。這也就意味著,ChatGPT對傳統搜尋引擎的衝擊,或將從部分業內人士的推測變為現實。

這似乎也解釋了為何在ChatGPT快速走紅後,Google內部啟動“Red Code”的原因。針對ChatGPT,Google內部包括研發、安全和信任等多個部門的團隊被重新分配了工作任務,被要求協助開發新的AI技術原型和產品。沒錯,在搜尋引擎會被ChatGPT取代這個問題上,Google也不復當初“ChatGPT還沒到能取代搜尋引擎”的自信。

ChatGPT與傳統的搜尋引擎有什麼區別呢?事實上,通常意義上的搜尋引擎,是指通過從網際網路上提取各網站的資訊,將其保存在自己建立的資料庫中、並建立索引,使用者發起檢索請求後,系統檢索與使用者查詢條件匹配的相關記錄,然後按一定的排列順序將結果返回給使用者。在使用者檢索資訊時,關鍵詞無疑是最為有效的手段。而在外界看來,奠定百度搜尋引擎的基礎,無疑就是李彥宏的《超鏈檔案檢索系統和方法》,其核心是以關鍵字作為核心權重來決定“目標頁面”的相關性和排序。

簡而言之,在搜尋引擎中搜尋資訊的大體流程,是使用者輸入關鍵詞、搜尋引擎在資料庫篩選匹配關鍵詞的結果,並為使用者排序出關聯度從高到低的連結。搜尋引擎的本質,是基於使用者輸入內容向使用者“推薦”結果,但打開哪一個內容還是需要使用者自己來選擇。從二十年前的雅虎、Google,到世紀之交的百度,再到後來的搜狗、360、DuckDuckGo,也都沒有脫離這套運行模式。

對於使用者而言,這二十餘年裡在搜尋框輸入關鍵詞,等待搜尋引擎展示網頁連結,再根據自己的需求打開網頁,幾乎是一成不變的,或許這也是在日新月異的網際網路世界中,為數不多的古典氛圍了。然而這樣的體驗卻是有缺憾的,因為彼時的電腦還不能完美理解使用者的需求,所以需要用關鍵詞來讓電腦將使用者的需求,劃定在一個模糊的範圍內。

相信許多朋友在通過搜尋引擎尋求問題的答案時,往往會在一個主題下嘗試不同的關鍵詞,這樣的效果顯然稱不上完美。而在滿足使用者資訊需求方面,ChatGPT則提供了一個完全不同的體驗,面對使用者需求ChatGPT是直接給出答案,避免了使用者的選擇,並實現了從搜尋問題到生產答案的一步到位式體驗。

雖然對於部分使用者來說,更希望將選擇權握在自己手裡,但抖音、TikTok在全球範圍內的成功,已經證明了絕大多數使用者是“懶惰”的。精準來說,大多數使用者希望借助推薦演算法來幫助自己檢索、並篩選資訊,並不反感網際網路廠商為他們營造一個“資訊繭房”。相比傳統搜尋引擎有輸入、檢索、整理、結果這四步,ChatGPT則直接跳過了中間的兩個步驟,實現了從輸入到結果這個新的搜尋方式。

而Google對ChatGPT極為警惕的背後,其實是使用者對於搜尋引擎的期望就是即時滿足資訊需要,而這也是ChatGPT的核心優勢。事實上,ChatGPT是OpenAI在2020年推出的自然語言識別模型GPT-3的衍生產品,並以從人類反饋中強化學習的方法訓練這一模型,基於GANs(生成對抗網路)讓ChatGPT在不斷的偵錯、迭代中,生成與真實資料無二的結果。

其實ChatGPT並不能理解使用者提問的意圖,也不理解人類語言中的邏輯,只是對1750億個訓練文字中字詞組合的出現率進行了統計,再按照使用者輸入的內容和統計出來的出現率排列字詞,來給出看起來合理的回覆。而“一本正經的胡說八道”,在ChatGPT上是十分常見的一件事。

如此龐大的資料自然能讓ChatGPT變得“無所不能”,其實從本質上來說,ChatGPT之所以顯得如此聰明,關鍵在於Open AI斥資1200萬美元為其訓練成本買單,它的底層運行邏輯依舊還是“基於統計的拼湊”。

TOP

發新話題