距離ChatGPT發布僅不到4個月,北京時間3月15日凌晨1時,美國創業公司OpenAI又推出了GPT-4。
如果把ChatGPT比作汽車,那么GPT-4便是安裝在汽車上的新一代引擎,和之前的版本相比,它更強大、更聰明、更全面,也更加商業化了。一系列的進階能力再度吸引科技圈的關注。
一代更比一代強
相比GPT-3.5,此次發布的GPT-4功能實現了好幾個方面的躍升:強大的識圖能力;文字輸入限制提升至2.5萬字(英語單詞);回答準確性顯著提高;能夠生成歌詞、創意文本,實現風格變化等。
與我們最初了解到的ChatGPT相比,GPT-4在“拒絕不當請求”和“避免有害內容方面”表現要好得多。
根據OpenAI實驗室的官方介紹,GPT-4是OpenAI在擴展深度學習領域的最新里程碑。GPT-4是一個大型多模態模型(接受圖像和文本輸入、輸出等),雖然在現實世界場景中,它的許多能力不如人類,但在各種專業和學術基準上可以擁有和人類同等水平的表現。
值得注意的是,ChatGPT是一個基于Web的語言模型,還沒有移動應用程序。雖然微軟和OpenAI都對將GPT-4集成到Bing搜索中的計劃守口如瓶,但GPT-4極有可能用于Bing聊天。除了多模態能力外,GPT-4還可以成功解決ChatGPT此前對用戶生成響應緩慢的問題。
GPT-4發布后,人工智能專家、風險投資公司Page One Ventures的合伙人克里斯·尼科爾森當場要求ChatGPT,自己只會說英語,不會說西班牙語,并要求其提供一份基礎性的知識提綱。于是ChatGPT立即提供了一份詳細且架構良好的教學大綱,它甚至還提供了一系列學習和記憶西班牙語單詞的技巧。
“它已經突破了精度的障礙”,尼科爾森如是說。
此外,GPT-4還具有響應圖像和文本的新功能。它可以回答有關圖像的問題,如果用戶給它一張冰箱內部的照片,它可以建議用里面的東西做幾頓頗具創意的餐食。它還更具備所謂的“幽默感”,可以認知笑話并講述笑話,甚至可以推理。
GPT-4的考試能力也非常引人關注,OpenAI表示,新系統可以在法律考試(針對美國41個州和地區的考生取得律師資格的標準化考試)中進入前10%左右。根據測試結果,它還可以在SAT考試中獲得1300分(滿分1600分),在生物學、微積分、宏觀經濟學、心理學、統計學和歷史等高中考試中獲得5分(滿分5分),相較上一代版本有明顯提升。
OpenAI技術報告顯示了GPT-4在一系列標準化測試中的優良表現。
不過,ChatGPT還沒有完全改掉喜歡胡編亂造的習慣,它仍然可能會生成完全錯誤的文本。
更加商業化的潛力
許多行業領導者認為,這項技術總能讓人回想起上世紀90年代初的光景——當時,創建網絡瀏覽器引發了跨時代的革命意義,現在,GPT-4可能會引領科技圈新一代的商業浪潮。本周,許多美國創業公司已經開始琢磨要怎么用GPT-4開發新的產品。
電子支付平臺Stripe表示,GPT-4已被用于有關欺詐檢測的業務中;金融服務公司摩根士丹利也在使用GPT-4來簡化內部技術流程;冰島政府與OpenAI合作,致力于保護和推廣冰島語。
“GPT-4創造力和速度都非常驚人”,美國的小型財務規劃公司Maybe創始人Josh Pigford表示,該公司計劃使用GPT-4來快速提取用戶的信用卡交易數據——它取代了工程師做的事情。
在醫學界,醫生甚至考慮使用GPT-4進行患者咨詢。美國北卡羅來納大學教堂山分校的心臟病專家Anil Gehi向這個聊天機器人描述了幾位患者的病史,這些患者都擁有復雜的醫療經歷,短短幾秒鐘內,ChatGPT就回復給Anil Gehi一系列專業的醫治方案。Anil Gehi表示,GPT-4充分考慮到了臨床情況,并列出了需要考慮的醫療情況,這讓人印象非常深刻。
“它不會取代人類醫生”,Anil Gehi補充說,“不過,這是我們可以在工作的同時使用的工具之一?!?/p>
盡管OpenAI目前尚未向公眾提供GPT-4的圖像功能,但用戶已經摩拳擦掌為此做好準備了。
創業公司DoNotPay的首席執行官約書亞·布勞德(Joshua Browder)表示,他計劃利用GPT-4強大的圖像功能來幫助自己做事。該公司名稱直譯為“不付錢”,最早是為了幫助用戶對付那些不合理的停車罰單,現在業務已經擴展到多個方面,包括為用戶提供法律咨詢的數字服務。
布勞德稱,GPT-4可以幫助用戶掃描他們的醫療賬單,與其他醫院比較價格,從而達到節約開支的目的。
“GPT-4比早期型號的性能要高很多倍”,布勞德說,“GPT-4甚至可以起草訴訟,早期的模型還沒到那么復雜的程度?!?/p>
記者:周秭沫
編輯:王哲希
責任編輯:畢丹丹
相關文章
猜你喜歡