当前位置: 江南文明网 > 科技 > 互联网 >

生成式AI创企的大问题

条评论

生成式AI创企的大问题

多个生成式人工智能初创公司已获得数十亿美元融资,但如果无法获取适合的数据,那么就可能走向失败。这是一项艰巨的任务,因为大公司通常不愿与初创公司分享专有数据,尤其是在开发大语言模型时。

风险投资公司Primary Venture Partners的联合创始人和普通合伙人布拉德·斯沃卢加(Brad Svrluga)表示:“我们看到很多公司都在人工智能领域寻求卓越应用,但他们往往无法获得能开发强大应用的数据,更不用说能帮助他们在业务中拥有强大竞争力的专有数据了。”

现在,拥有合适数据比以往任何时候都更加重要。投资公司Bullpen Capital的驻场首席技术官保罗·泰马(Paul Tyma)表示,现在开发实际模型已经趋于商业化,真正的价值就在于数据。

根据PitchBook的统计,去年全年生成式人工智能初创公司获得的风险投资为48亿美元,但今年前五个月已经达到127亿美元。现在,其中许多公司都在金融或医疗保健等领域寻求构建更小众的人工智能模型,但要获得相关领域的训练数据集并不容易。

一些人工智能初创公司的目标是与拥有丰富数据的大型企业建立合作关系。例如,安永负责税务的全球副总裁玛娜·里克(Marna Ricker)表示,由于公司拥有海量的交易数据,每天都有开发生成式人工智能的初创公司前来接洽。但安永负责客户服务的全球管理合伙人安迪·鲍德温(Andy Baldwin)表示,他担心如果用安永的数据来训练外部模型会发生什么。

“到底谁拥有这些数据?当我们训练模型时,我们的访问权限是什么?其他人该如何使用这个模型呢?”鲍德温说。“数据也是我们知识产权的一部分。”

初创公司可以用每个客户的数据训练不同的模型,从而绕过知识产权问题。创业公司TermSheet正在利用这一策略打造生成式人工智能模型Ethan,这款产品可以为房地产开发商、经纪人和投资者解答行业问题。但TermSheet首席执行官兼联合创始人罗杰·史密斯(Roger Smith)表示,即便是让客户同意这样做,也需要费一番口舌。