商湯科技董事長徐立：AI2.0生產力工具，目前能解決的問題不足10%

來源：證券之星作者:葉子琪發布時間：2024-03-24 20:03 閱讀量：5947

3月23-24日，2024全球開發者先鋒大會在上海召開。

開幕式上，商湯科技董事長兼CEO徐立分享了對AI 2.0時代生產力工具“質”變背后的思考和突破路徑。他表示:“AI 2.0時代，生成式AI被視為推動生產力進步的重要技術。”

徐立認為，隨著大模型的發展，人工智能的關注點從感知智能轉向生成式內容，進入AI 2.0時代。不過，雖然業內已經開始使用AI 2.0時代的生產力工具，但這些工具帶來的生產效率提升效果并不明顯，所能解決的問題占比不足10%，給生產鏈路帶來的突破相對有限。

“如果能在知識、推理、執行三層能力上實現突破，將真正帶來整個社會生產力的跨越式發展。” 徐立表示。

ChatGPT、Copilot、Blackwell是AI 2.0時代的代名詞。搜索數據顯示，中國對于這些詞的關注熱度位居世界榜首，這代表著中國近千萬的開發者以及普羅大眾對于AI能夠帶來的變化熱切關注。

在開源社區GitHub上，生成式AI項目、大模型項目以及輔助編程、輔助開發的工具項目層出不窮。徐立表示，對于開發者來說，生成式AI是最好的帶來生產力工具，帶來生產力突破的行業。

業內普遍認為，代碼是大模型最明確的應用方向之一。百度創始人、董事長兼CEO李彥宏近期大膽表示，以后不會存在“程序員”這種職業。

早在2021年，GitHub就和OpenAI聯合開發的AI編程助手GitHub Copilot，基于GPT-3模型的Codex構建，通過分析大量開源代碼庫學習編程模式。它提供代碼補全、上下文感知建議、IDE內聊天式幫助以及代碼解釋等功能，支持多種編程語言和框架。

2023年3月，在ChatGPT火爆全球之后，GitHub又基于GPT-4模型打造Copilot X開發平臺，Copilot Chat是其主要功能之一，通過文本問答的方式就能生成、分析、審核代碼等。

近期，創業團隊Cognition AI更是開發出全球首個AI程序員智能體Devin，它具備自主學習新技術、端到端構建和部署應用、自主查找和修復代碼Bug、訓練和微調AI模型的能力，人類只需扮演一個下指令和監督的角色。

在SWE-bench基準測試中，Devin解決了13.86%的實際編程問題，展現了超越其他AI模型的性能。相較之下，GPT-4只能處理1.74%的問題。

不過，這個數據也顯示了新生產力工具的準確率和完成度普遍較低，較業內期望仍有待提高，徐立認為，雖然整個行業在往前走，但目前還是處于相對雛形。

“軟件開發全生命周期包括需求分析、設計、開發、測試、部署和維護諸多環節。雖然目前AI能夠帶來很多革新，或者擴展到很多場景，但目前僅能解決其中非常小眾的部分。”徐立表示。

他表示，具體而言，AI目前能解決的是在過往基礎上抽象成比較標準化，甚至以知識庫的形式固化下來的內容，包括代碼補全、代碼增寫以及部分測試用例等。如果把它分攤到整個軟件或者產品設計的全流程當中，占比并不高。

“當然，隨著擴展能力變強，很多工具會從前端的設計、測試用例再到維護的橫向拓展，一步步往前演進。”徐立表示。

一個有意思的現象是，編程經驗越豐富，不代表就越能用好新的生產力工具。統計數據顯示是相反的:工作五年以下的程序員使用新生產力工具解決問題時長超過一小時，但五年以上的程序員反而更短。這意味著越是高階、復雜的任務，對于當前新生產力工具來說還有一定的挑戰。

這與大模型能力有關。徐立表示，大模型能力可分為三層架構，而且這三層之間互有依賴，但又相對獨立。

第一層知識，世界知識的全面灌輸。“目前，許多生產力工具解決的都是知識層的問題，當用戶提出問題時，其底層的邏輯都來自于‘世上無新事’——你所面臨的問題，前人可能已經遇到過并解決了，因此通過大模型可以很好地完成這些任務。”徐立表示。

第二層推理，理性思維的質變提升。有了世界知識之后，再往前演進。即使不知道這件事實，也可通過AI逐步把這個事實推理出來，給出更多的可能性。

“知識和推理是作為生產力工具——大模型最重要的兩層，但目前在推理層，成長還相對有限，這也是今后要集中突破的能力之一。”徐立表示。

第三層執行，世界內容的互動變革，即如何跟這個世界互動反饋。徐立表示，某種意義上，如今火熱的具身智能，在執行上會有很大的突破。

總體來講，這三層可以組成一個完備的對于世界提供生產力工具模型的三層能力。

“從軟件開發上，知識層是代碼的補全，補全的代碼來自別人寫過的代碼；推理層真正深入到軟件開發的全流程；執行層是進入切分到垂直場景當中，以場景化的智能為依歸。”徐立表示，知識層主要解決高頻、標準化問題，做別人做過的問題，顯然準確率高；推理主要解決長尾、碎片化的問題。

以商湯的軟件智能研發助手“小浣熊”為例，據徐立介紹，如果去年用“小浣熊”代碼補助工具，可節省30%的工作量。在整個過程里，它的工作主要基于一個代碼庫，解決的還是一些重復性的勞動。

在此基礎上，商湯進一步整合了從需求分析、需求設計到長尾應用等各個環節，推出“小浣熊”2.0版本。它可以基于海量數據篩選出需求，制定產品特征，完成產品的自主開發。

而它的下一步，則是在獲得世界知識的基礎上，進一步應用到更多的機器人場景當中。

“我認為生產力工具如果在現在三層能力上都有突破的話，首先受益的是廣大開發者以及場景化的核心應用，最終將真正帶來整個社會生產力的跨越式發展。”徐立表示。

鄭重聲明：此文內容為本網站轉載企業宣傳資訊，目的在于傳播更多信息，與本站立場無關。僅供讀者參考，并請自行核實相關內容。

即時閱讀