研究表明:谷歌Gemini在健康指导方面超越人类教练

9个月前发布AI俱乐部
2 0 0
研究表明:谷歌Gemini在健康指导方面超越人类教练的封面图

據報導,Google 的 Gemini 模型能夠處理多種輸入,例如文字、程式碼、音訊、影像和影片,展現了卓越的理解、推理和總結能力,甚至可以透過程式設計產生創意內容。不僅如此,這個新模型還採用了大型語言模型 (LLM) 技術,在多項基準測試中超越了人類專家。

Google 的目標是建立一個能夠處理多種模態的大型語言模型 (PH-LLM),這正是他們開發 Gemini 的原因,旨在實現通用性和廣泛的應用,涵蓋文字理解和圖像生成等多個領域。該團隊希望透過此模型,在各個領域和任務中都能展現卓越的性能。在他們看來,模型應能無縫地結合領域知識和通用技能,從而在各個領域都能提供有價值的結果。

為了達到卓越的性能,開發人員投入了大量的運算資源,並且在訓練的早期階段就融入了額外的專業知識。其中一個關鍵是「模態性的廣度」,旨在提升在各種情境中的適應性和效率。透過引入多種不同類型的数据,例如程式碼、知識和推理資料,可以顯著提升「零樣本」的能力。也就是說,這個模型無需額外的訓練,就能具備執行多種任務的能力。對他們而言,這不僅僅是追求更好的效能,更重要的是讓模型更具適應性,能夠應對未來可能出現的各種挑戰。值得一提的是,他們對模型的回應能力也抱持高度期待。

為了解決這個問題,Google 的研究團隊在 PH-LLM 模型中採用了程式碼生成和綜合推理等技術,期望能夠克服大型語言模型在知識整合和推理方面的固有挑戰。透過採用高效的「少樣本」方法(即只需要少量的範例即可進行學習),模型能夠展現更強的泛化能力和適應性。

研究結果顯示,PH-LLM 在程式碼生成方面取得了 79% 的準確率,在知識整合方面取得了 88% 的準確率,這兩項指標都超越了現有的基準模型,並且在資料獲取(準確率提高 13.8%)和問題解決(準確率提高 25%)方面也展現了卓越的性能。在知識整合和程式碼生成方面的準確率分別為 71% 和 76%。

模型聲明:「我們正在與一個跨領域的專家團隊合作,旨在將 Gemini 模型的前沿能力與 Google 產品的創新能力和可訪問性相結合。」

為了實現這個目標,Google 的研究團隊正在積極地整合創新和專業知識,同時專注於提升模型的可訪問性和性能,並針對複雜的任務進行了優化和調整。他們整合了 857 個 TPU 的 Google 基礎架構,以支援模型和知識整合的訓練。他們在這些領域投入了大量的運算資源,以便能夠開發出更精準、更可靠的解决方案。研究人員希望確保產品能够充分地利用模型、知识和综合能力,以实现更卓越的成果。

經過幾個月的開發,Google 宣布了即將推出的 PH-LLM,它具有多種功能,能夠促進信息获取(無論是圖像還是文字)和知識共享。為了實現這個目標,該公司正在探索如何結合多種不同的技能,為更廣泛的受眾提供價值(無論是學術還是商業)。

此外,Google 對 PH-LLM 的期望不僅僅是成為一種工具,更希望它能够融入到「協作介面」的格局中,從而能夠更加高效地使用模型和知識。

© 版权声明:
本文地址:https://aidh.net/kuaixun/dmuclq5t

暂无评论

none
暂无评论...