通說:來自廣東的他,讓硅谷刮目相看最近,中國的APP屢屢霸榜,前有收留tiktok難民的小紅書,後有人工智能新秀DeepSeek,據稱這款AI工具價格是GPT-4 Turbo的百分之一,被稱為AI界的“拼多多”,不少國外技術人員非常喜歡。 1月27日,由杭州深度求索開發的DeepSeek應用登頂蘋果中國地區和美國地區應用商店免費APP下載排行榜,在美區下載榜上超越了ChatGPT。 這家公司在外國AI界受到極大讚譽,在被美國禁止各種高性能芯片的中國,居然有公司用五百多萬美元和低功能芯片,做出了OpenAI投入不止十億美金和採用高端芯片的成果。DeepSeek還是內地除了商湯、百度、騰訊、字節跳動和阿里五大巨頭以外,唯一擁有超過一萬張A100顯卡的公司。因此也被很多AI界的人士形容為“來自東方的神秘力量”。 公司的創始人也一直十分神秘,直至近日央視新聞聯播的一則新聞,大家才見到真面目。在1月20日中國國務院總理主持召開的專家、企業家和教科文衛體等領域代表座談會上, 梁文鋒作為代表發言,逐漸為外界所認識。 鏡頭掃過,一雙黑框眼鏡、一身灰色西服、略顯消瘦的身形,讓一眾理工男羨慕的發量,十分普通的路人長相,竟是AI大佬。 公開信息顯示,梁文鋒1985年生人,從小熱愛數學建模,17歲時以湛江吳川一中“高考狀元”的成績考上浙江大學本科電子信息工程專業,於2007年考上浙江大學信息與通信工程專業研究生。 在2023年創立深度求索品牌DeepSeek之前,梁文鋒在做證券投資。 梁文鋒畢業後與校友成立了投資公司,聚焦量化交易。2019年,幻方量化管理規模突破百億人民幣,成為國內量化私募“四巨頭”之一。此後的幻方量化甚至一度成為中國首家突破千億的私募量化大廠,也是迄今為止業內唯一規模曾邁過千億人民幣大關的量化私募。 2023年7月,梁文鋒創辦了杭州深度求索人工智能基礎技術研究有限公司,就是DeepSeek公司。此時美國的Open AI已經發佈GPT-4,全球關注。但從私募積累了資金和算力的DeepSeek,還是很快追趕上來了。 有分析認為,DeepSeek之所以震撼硅谷,在於其顛覆了以GPT為代表的傳統AI。後者的策略本質是“在人類監督下的猜字謎游戲”,最多生成一些“看似靠譜實則無法深究”的東西,根本沒有辦法投入現實、轉化為生產力工具。但DeepSeek不一樣,DeepSeek是真的會“思考”,或者“推理”。 在2023年的一場訪談中,梁文鋒就說過,我們理解人類智能本質可能就是語言,人的思維可能就是一個語言的過程。你以為你在思考,其實可能是你在腦子里編織語言。這意味著,在語言大模型上可能誕生出類人的人工智能(AGI)。 這篇訪談據說是技術宅男梁文鋒的首次受訪,語言簡潔,充滿對人工智能純粹的好奇。 此外,在特朗普上台後,芯片制裁風波來襲。而DeepSeek的成功,意味著之前一個階段里美國的“小院高牆”制裁策略可能要失效了。 諾貝爾物理獎得主、“AI教父”傑佛瑞·辛頓在1月21日的專訪中表示,儘管美國試圖通過限制晶片等來減緩中國的發展,但這隻會促使中國加速發展自己的技術,“他們可能會落後幾年,但最終會趕上”。 紐約時報的文章說,隨著美國政府努力保持本國在全球人工智慧競爭中的領先地位,它正在試圖對能出售給中國以及其他競爭對手的高性能晶片進行限制。但DeepSeek大模型的表現讓人們對美國政府貿易限制的意外後果產生了質疑。美國的出口管制措施已迫使中國研究人員使用互聯網上免費提供的各種工具來發揮創造力。 梁文鋒曾這樣總結中國AI和美國AI的差距。“我們看到的是中國AI不可能永遠處在跟隨的位置。我們經常說中國AI和美國有一兩年差距,但真實的gap是原創和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。” (完) 【編輯:陳卓儀】
|