ChatGPT引爆「向量数据库」赛道!两家公司共获10亿元融资-世界观焦点
2023-05-03 14:34:18 来源:雪球网 小 中
ChatGPT引爆「向量数据库」赛道!两家公司共获10亿元融资
原创 AIGC开放社区 2023-05-01 07:48
4月22日,向量数据库平台(vector database)Weaviate宣布获得5000万美元(约3.5亿元)B轮融资,由Index Ventures领投,Battery Ventures等跟投。
(资料图)
4月28日,向量数据库平台Pinecone宣布获得1亿美元(约7亿元)B轮融资,由Andreessen Horowitz领投,ICONIQ Growth等跟投。
最近,为ChatGPT等生成式AI应用提供向量搜索、向量数据存储、向量嵌入等功能的向量数据库赛道突然走红,两家初创公司Pinecone和Weaviate的融资时间仅间隔6天,其火爆程度可见一斑。
Pinecone联合创始人兼首席执行官Edo Liberty则直言,如果没有ChatGPT的出现,我们根本不可能获得巨额融资。
事实上,在ChatGPT火爆出圈之前向量数据库非常小众,而Pinecone和Weaviate皆创立于2019年无论是融资还是营收并不如意,因为,大型科技巨头具备自研能力无需使用第三方产品,例如,微软将向量搜索技术应用在Bing中。
现在,大量开发者涌向生成式AI应用开发领域,这使得蛰伏4年的两家向量数据库厂商终于迎来了曙光,其用户数量呈指数级增长,也是获得巨额投资的重要原因之一。
Pinecone融资信息
当创业者的目光聚焦在类ChatGPT大语言模型、应用、衍生产品时,为其提供“后勤服务”的向量数据库拓宽了生成式AI细分创业赛道,并成为下一代生成式AI应用的主要数据库存储。
不过,目前向量数据库存储只有大型科技巨头才能使用,而Pinecone和Weaviate希望简化使用流程降低成本,使得中小型企业、个人开发者也能使用向量数据库。
,时长02:37
微软专家介绍向量搜索此外,根据 IDC调查数据显示,全球在AI技术和服务上的支出2023年将达到1540亿美元,到2026年将超过3000亿美元。其中,向量数据库为AI的开发、增强内容生成的准确性提供了重要技术支撑。
下面「AIGC开放社区」将为大家介绍向量数据库技术概念、与ChatGPT等大语言模型的关系、技术特征、场景化落地以及Pinecone和Weaviate这两家典型厂商的介绍。
Weaviate融资信息
什么是向量数据库
笔者查询了国外大量权威的论文、专业技术网站,甚至询问了ChatGPT,它们对向量数据库的技术概念解释非常复杂难以理解。所以,就用通俗易懂的方式为大家介绍向量数据库概念。
微软官方对向量数据库的解读
简单来说,向量数据库用来存储非结构化数据,例如,文档、图片、视频、音频和纯文本等,在保证100%信息完整的情况下,通过向量嵌入函数来精准描写这些非结构化数据的特征,从而提供查询、删除、修改、元数据过滤等操作。而像SQL、Mysql这样传统的数据库根本无法完成这些操作。
从向量数据库的技术特性不难看出,这是专门为ChatGPT等生成式AI应用量身定制,例如,让ChatGPT用莎士比亚的语气生成一段诗句,ChatGPT通过向量数据库的相似搜索功能,可以增强内容输出的准确性。
因此,向量数据库在大语言模型、计算机视觉、推荐系统以及其他需要语义理解和数据匹配的领域得到广泛应用。
向量数据库主要功能和用例
向量数据库除了存储数据之外,还提供了语义搜索、图像/音频/视频/等非结构化数据相似度搜索、排名和推荐引擎、支持大规模数据、索引与压缩技术、分布式架构等功能。
语义搜索:通常搜索文本和文档可以用两种方式完成,词法搜索和精准的单词或字符串匹配。向量数据库的语义搜索可以理解文本、句子和整个文档字符串的含义和上下文,从而提供更准确和相关的搜索结果。
图像/音频/视频/等非结构化数据相似度搜索:图像、音频、视频和其他非结构化数据集,在传统数据库中进行分类存储非常具有挑战性,通常需要将关键字、描述和元数据手动应用于每个对象。
向量数据库的相似性搜索功能,如余弦相似性、欧氏距离等度量来衡量向量间的相似性。这使得用户在处理如图像识别、推荐系统等变得非常高效。
排名和推荐引擎:该功能对于电商、搜索引擎来说非常有用,例如,微软的Bing,网易云音乐的推荐都应用了该技术。该功能主要基于用户最近匹配项查找相似项目,使向量数据库为用户提供相关的最佳内容选择,并且可以根据相似性分数对项目进行排名。
支持大规模数据:向量数据库具有良好的扩展性,能够支持大规模的向量数据存储和检索。这对于处理海量数据的大语言模型、机器学习、数据科研等非常有用。
索引与压缩技术:为了提高搜索速度和降低存储成本,向量数据库通常采用先进的索引和压缩技术。这些技术可以有效地降低数据的存储空间,提高查询速度,并降低内存占用。
分布式架构:为了实现高可用性和容错能力,向量数据库采用分布式架构。这使得用户可以在多个计算节点上分布存储和处理数据,提高系统的整体性能。
$创意信息(SZ300366)$ $中国软件(SH600536)$ $昆仑万维(SZ300418)$
关键词:
相关文章
- ChatGPT引爆「向量数据库」赛道!两家公司共获10亿元融资-世界观焦点
- IVD上市公司董事长的一条朋友圈,惊醒无数人!|全球百事通
- 百度文心大模型突破性成果:中国企业首次以第一完成单位登顶《Nature》正刊
- 美半导体协会总裁:中国是我们最大的市场 我们不能缺席 环球热文
- 五一后机票价格大幅下降
- “小聚居、大空间”!露营经济带靓日照山海天全域旅游
- 餐具饮具集中消毒服务单位违反食品安全法_餐具饮具集中消毒服务单位卫生监督工作规范_全球观点
- 今天最新消息 92.7%受访00后对新职业感兴趣 找工作看重待遇和前景
- 更古村志愿服务大队_对于更古村志愿服务大队简单介绍_世界快消息
- 天天简讯:杭州海底捞五一假期前三天接待人次超15万,同比增长近七成
- 全球即时看!撬动汽车消费,各地促销活动持续火热
- 珠海口岸“五一”假期查验出入境人员240余万人次-世界讯息
- 环球观热点:格力电器2022年报印象:经营尚算稳健,分红不及预期
- 环球精选!乐普医疗商业模式浅析(下)
- A股:本周四、五股市走势分析预测,不废话上重点-观察
- 天天热文:返程请注意!四川多地有雨҈雨҈雨҈
- 宁波诺丁汉大学传播学就业方向_传播学就业方向
- 更做到_对于更做到简单介绍 环球聚焦
- 矿产勘查地质学 全球观察
- 楼上装修的时候,自身过错水泥堵了阳台的存水弯的下水道,楼下刚装修好
- 财报分析进阶之 通威2023年的利润 时快讯
- 短线→中线→长线的历程
- 今年我参加了股东大会!
- 当前动态:香港警队招募取消最低身高要求,增设“中英文笔试”
- 男扮女装久了会怎样_长期男扮女装生活
- 热推荐:红烧黄花鱼的家常做法_红烧小黄鱼的家常做法
- 热议:5月3日大理至昆明增开2列普速旅客列车 助力客流返程
- 焦点快报!北京玉渊潭公园:因天气原因,公园游船今天14时停止售票
- 全球观热点:跨过人性做投资!
- 【5月关注】3大黑马横空出世:AI+电竞赋能公司,潜力巨大!-全球最资讯
热文推荐
排行推荐

五一后机票价格大幅下降

“小聚居、大空间”!露营经济带靓日照山海天全域旅游

餐具饮具集中消毒服务单位违反食品安全法_餐具饮具集中消毒服务单位卫生监督工作规范_全球观点
