總部位於舊金山的人工智能初創公司Writer週三(當地時間10月9日)推出了一款大型人工智能模型,與OpenAI、Anthropic等公司的企業產品競爭。但與其中一些競爭對手不同,這款產品不需要花那麼多錢來訓練人工智能。
該公司花費了大約70萬美元來訓練最新模型,而競爭對手的初創公司則花費了數百萬美元來構建自己的模型。它的策略引起了投資者的注意。Writer正在以19億美元的估值籌集高達2億美元的資金。這幾乎是該公司2023年9月估值的四倍,當時該公司以超過5億美元的估值籌集了1億美元。
該公司使用合成數據或人工智能創建的數據來削減成本,旨在模仿通常輸入模型的現實世界信息,而不會損害隱私,並且正在成為一種更受歡迎的訓練方法。
人工智能研究人員在6月修訂的一項研究發現,如果目前的人工智能發展趨勢繼續下去,科技公司將在2026年至2032年期間“完全耗盡”公開可用的訓練數據,並寫道“人類生成的公共文本數據無法維持本十年後的擴展。”
根據該公司發佈的職位描述,亞馬遜已使用合成數據訓練Alexa,Meta已使用合成數據微調其Llama模型,微軟支持的OpenAI正在將其納入其模型中。
Writer聯合創始人兼首席技術官Waseem Alshikh表示,Writer多年來一直在研究其合成數據管道。要明確的是,我們不會在假數據或幻覺數據上訓練我們的模型,我們也不會使用模型來生成隨機數據。我們獲取真實的事實數據,並將其轉換為以更清晰、更乾淨的方式專門構建的合成數據,用於模型訓練。”
生成式人工智能市場有望在十年內實現1萬億美元的收入。據PitchBook稱,截至2024年,投資者已向498筆生成式人工智能交易投資了268億美元,該行業的公司在2023年籌資259億美元,比2022年增長了200%以上。