Zilliz 创始人星爵亮相 GAIR 2023！向量数据库成大模型开发者关注焦点

2023-08-16 15:40:24 来源：今日热点网

小大

近日，由 GAIR 研究院、雷峰网、世界科技出版社、科特勒咨询集团联合主办的第七届 GAIR 全球人工智能与机器人大会，在新加坡乌节大酒店拉开帷幕。

此次大会是在大模型技术爆炸时代，国内首个出海的 AI 顶级论坛，也是中国人工智能影响力的一次跨境溢出。本届大会共开设 10 个主题论坛，聚焦大模型时代下的 AIGC、Infra、生命科学、教育、SaaS、web3.0、跨境电商等热门领域的变革创新。

其中，“大模型时代超级基建”的主题引发业内的激烈讨论。过去数年间，AI 领域应用落地曾一度乏善可陈。但在刚刚过去的几个月，ChatGPT 引爆了大模型的浪潮。尽管如此，当前的大语言模型的训练然面临诸多挑战。“大模型时代的超级基建”旨在与行业头部公司共同探讨 AI 底层基础设施相关话题。Zilliz 创始人兼 CEO 星爵在“大模型时代超级基建”环节进行了主题演讲，并参与圆桌论坛的讨论。

星爵指出，过去十年，受限于研发成本和开发难度，全球仅有 1% 的开发者专注于 AI 领域的研发工作。但如今，有了大模型和向量数据库作为能力基座，一个 AI 应用的开发仅仅需要两三个工程师一个周末的时间便可完成。正可谓“忽如一夜春风来，千树万树梨花开。”

此外，星爵还强调了向量数据库之于大模型的重要性。他认为，向量数据库承担着大模型数据片外存储的重任，不管是图片、视频语言还是生物学中蛋白质的三维结构，都可以用向量的方式表征它的语义。

针对数据实时性和私域专有数据的问题，星爵表示，学术界和工业界存在两种解决方案，一是通过Fine tuning的方式迭代演进，让大模型学到更多知识；二是通过 Vector search方法，把最新的或私域知识存到向量数据库中，需要时再在向量数据库中做基于语义的向量检索。上述两种方法都能为大模型提供更加精准的答案。

不过，星爵也坦言，从成本角度出发，向量数据库的成本是 Fine tuning的1/ 1000。所以大模型厂商都无一例外地推荐开发者使用向量检索的方式做知识库管理，以便和模型有一个更好交互，降低落地使用成本的同时，提升在业务中的实际效果。