ChatGPT引爆「向量数据库」赛道!两家公司共获10亿元融资-世界观焦点

2023-05-03 14:34:18 来源:雪球网

ChatGPT引爆「向量数据库」赛道!两家公司共获10亿元融资

原创 AIGC开放社区 2023-05-01 07:48

4月22日,向量数据库平台(vector database)Weaviate宣布获得5000万美元(约3.5亿元)B轮融资,由Index Ventures领投,Battery Ventures等跟投。


(资料图)

4月28日,向量数据库平台Pinecone宣布获得1亿美元(约7亿元)B轮融资,由Andreessen Horowitz领投,ICONIQ Growth等跟投。

最近,为ChatGPT等生成式AI应用提供向量搜索、向量数据存储、向量嵌入等功能的向量数据库赛道突然走红,两家初创公司Pinecone和Weaviate的融资时间仅间隔6天,其火爆程度可见一斑。

Pinecone联合创始人兼首席执行官Edo Liberty则直言,如果没有ChatGPT的出现,我们根本不可能获得巨额融资。

事实上,在ChatGPT火爆出圈之前向量数据库非常小众,而Pinecone和Weaviate皆创立于2019年无论是融资还是营收并不如意,因为,大型科技巨头具备自研能力无需使用第三方产品,例如,微软将向量搜索技术应用在Bing中。

现在,大量开发者涌向生成式AI应用开发领域,这使得蛰伏4年的两家向量数据库厂商终于迎来了曙光,其用户数量呈指数级增长,也是获得巨额投资的重要原因之一。

Pinecone融资信息

当创业者的目光聚焦在类ChatGPT大语言模型、应用、衍生产品时,为其提供“后勤服务”的向量数据库拓宽了生成式AI细分创业赛道,并成为下一代生成式AI应用的主要数据库存储。

不过,目前向量数据库存储只有大型科技巨头才能使用,而Pinecone和Weaviate希望简化使用流程降低成本,使得中小型企业、个人开发者也能使用向量数据库。

,时长02:37

微软专家介绍向量搜索此外,根据 IDC调查数据显示,全球在AI技术和服务上的支出2023年将达到1540亿美元,到2026年将超过3000亿美元。其中,向量数据库为AI的开发、增强内容生成的准确性提供了重要技术支撑。

下面「AIGC开放社区」将为大家介绍向量数据库技术概念、与ChatGPT等大语言模型的关系、技术特征、场景化落地以及Pinecone和Weaviate这两家典型厂商的介绍。

Weaviate融资信息

什么是向量数据库

笔者查询了国外大量权威的论文、专业技术网站,甚至询问了ChatGPT,它们对向量数据库的技术概念解释非常复杂难以理解。所以,就用通俗易懂的方式为大家介绍向量数据库概念。

微软官方对向量数据库的解读

简单来说,向量数据库用来存储非结构化数据,例如,文档、图片、视频、音频和纯文本等,在保证100%信息完整的情况下,通过向量嵌入函数来精准描写这些非结构化数据的特征,从而提供查询、删除、修改、元数据过滤等操作。而像SQL、Mysql这样传统的数据库根本无法完成这些操作。

从向量数据库的技术特性不难看出,这是专门为ChatGPT等生成式AI应用量身定制,例如,让ChatGPT用莎士比亚的语气生成一段诗句,ChatGPT通过向量数据库的相似搜索功能,可以增强内容输出的准确性。

因此,向量数据库在大语言模型、计算机视觉、推荐系统以及其他需要语义理解和数据匹配的领域得到广泛应用。

向量数据库主要功能和用例

向量数据库除了存储数据之外,还提供了语义搜索、图像/音频/视频/等非结构化数据相似度搜索、排名和推荐引擎、支持大规模数据、索引与压缩技术、分布式架构等功能。

语义搜索:通常搜索文本和文档可以用两种方式完成,词法搜索和精准的单词或字符串匹配。向量数据库的语义搜索可以理解文本、句子和整个文档字符串的含义和上下文,从而提供更准确和相关的搜索结果。

图像/音频/视频/等非结构化数据相似度搜索:图像、音频、视频和其他非结构化数据集,在传统数据库中进行分类存储非常具有挑战性,通常需要将关键字、描述和元数据手动应用于每个对象。

向量数据库的相似性搜索功能,如余弦相似性、欧氏距离等度量来衡量向量间的相似性。这使得用户在处理如图像识别、推荐系统等变得非常高效。

排名和推荐引擎:该功能对于电商、搜索引擎来说非常有用,例如,微软的Bing,网易云音乐的推荐都应用了该技术。该功能主要基于用户最近匹配项查找相似项目,使向量数据库为用户提供相关的最佳内容选择,并且可以根据相似性分数对项目进行排名。

支持大规模数据:向量数据库具有良好的扩展性,能够支持大规模的向量数据存储和检索。这对于处理海量数据的大语言模型、机器学习、数据科研等非常有用。

索引与压缩技术:为了提高搜索速度和降低存储成本,向量数据库通常采用先进的索引和压缩技术。这些技术可以有效地降低数据的存储空间,提高查询速度,并降低内存占用。

分布式架构:为了实现高可用性和容错能力,向量数据库采用分布式架构。这使得用户可以在多个计算节点上分布存储和处理数据,提高系统的整体性能。

$创意信息(SZ300366)$ $中国软件(SH600536)$ $昆仑万维(SZ300418)$

关键词:

相关文章

热文推荐

ChatGPT引爆「向量数据库」赛道!两家公司共获10亿元融资-世界观焦点
ChatGPT引爆「向量数据库」赛道!两家公司共获10亿元融资-世界观焦点

ChatGPT引爆「向量数据库」赛道!两家公司共获10亿元......更多>

IVD上市公司董事长的一条朋友圈,惊醒无数人!|全球百事通
IVD上市公司董事长的一条朋友圈,惊醒无数人!|全球百事通

文 江必旺(纳微科技董事长)我曾经很羡慕别的创业公......更多>

百度文心大模型突破性成果:中国企业首次以第一完成单位登顶《Nature》正刊
百度文心大模型突破性成果:中国企业首次以第一完成单位登顶《Nature》正刊

北京时间5月2日凌晨,国际顶级学术期刊《Nature》正刊......更多>

美半导体协会总裁:中国是我们最大的市场 我们不能缺席 环球热文
美半导体协会总裁:中国是我们最大的市场 我们不能缺席 环球热文

美国半导体行业协会称,尽管美国政府存在所谓“国家安......更多>

排行推荐

五一后机票价格大幅下降
五一后机票价格大幅下降
从5月1日开始,机票价格开始大幅度跳水。已有机票从28... 更多>
“小聚居、大空间”!露营经济带靓日照山海天全域旅游
“小聚居、大空间”!露营经济带靓日照山海天全域旅游
“拥抱星辰大海,追逐诗和远方”。4月30日,日照山海... 更多>
餐具饮具集中消毒服务单位违反食品安全法_餐具饮具集中消毒服务单位卫生监督工作规范_全球观点
餐具饮具集中消毒服务单位违反食品安全法_餐具饮具集中消毒服务单位卫生监督工作规范_全球观点
1、(试行)第一条为规范餐饮具集中消毒单位的卫生监... 更多>
今天最新消息 92.7%受访00后对新职业感兴趣 找工作看重待遇和前景
今天最新消息 92.7%受访00后对新职业感兴趣 找工作看重待遇和前景
92 7%受访00后对新职业感兴趣受访00后找工作主要看重... 更多>
“战国”中的牧原(十二)----生猪行业未来竞争格局与周期 每日快报
$牧原股份(SZ002714)$$万华化学(SH600309)$$苹果(AAPL... 更多>
芯片十问十答
观点仅供参考,买卖需要择时!1:芯片种类繁杂,哪些... 更多>
天天热推荐:一季报牛散持股汇总
股市从不缺股神,而在这周而复始的过程中,能长存并持... 更多>
播报:放松身心亲近自然 自驾露营成旅游新风尚
今年“五一”假期,我国旅游业的快速恢复催生自驾露营... 更多>
每日热门:东吴证券:给予鼎胜新材买入评级,目标价位49.0元
东吴证券股份有限公司曾朵红杨件阮巧燕岳斯瑶近期对鼎... 更多>
【港股异动】GUANZE MEDICAL(02427.HK)跌10.42%-当前播报
五一小长假的到来也意味着A股上市公司都已披露完2022... 更多>
Mate10满血复活!鸿蒙3大家庭设备超百款
华为正式官宣了鸿蒙3系统的新机升级进度,本次新升级... 更多>
逾9成民众挺洗钱禁参选!网友轰扁家不要脸
针对“行政院”版《公职人员选举罢免法》修正草案,规... 更多>
未及时披露政府补助情况,乐凯新材收深交所监管函 环球聚看点
乐凯新材4月28日收到深交所监管函,公司于2022年4月收... 更多>
熔断 停牌!纽交所:退市!美联储加息概率骤降近20%_世界播报
大家好,明日内盘开市,国际市场又崩了 昨... 更多>

第一共和救了,美国地区银行为何又

牧原股份、温氏股份、新希望等六大

每个人都可以管理好自己的情绪和资

特斯拉在多国提高售价 价格仍低于

干部在包间喝酒划拳,推门进来了检

节后两日解禁超1100亿元,昔日疫苗

“小锁”退出舞台,谷歌 Chrome

最新:广州地铁几点停运最晚几点开

香港GDP活起来,首季升2.7%扭转去年

五一我在岗|致敬奋战在交通建设一