爱数智慧创始人兼CEO张晴晴
作者丨巴里
编辑丨子钺
图源丨受访者
“能够让机器理解人的所思所想,并能够将这些内容转化成文字是一件很酷的事情。”
17年前,还在北邮读通信的本科生张晴晴偶然间接触到了语音识别。她当时也许没有料到,在接下来的17年,语音识别会与她的理想与事业结下不解之缘。
在人工智能三驾马车中,数据是算法的基础,就好比原油,只有经过清洗、分类、标注、质检和筛选等结构化过程,才能用于AI模型训练。
年,已经在中科院声学所从事对话式AI研究的张晴晴意识到,如果不从根本上解决数据的问题,人工智能在未来几年仍然会面临巨大的挑战。
就这样,肩负着这份理想与情怀,一位女科学家开启了创业之旅,创立了爱数智慧。
据介绍,目前,爱数智慧已处于AI语音数据服务行业的第一梯队,为超家国内外头部互联网公司、移动通信、知名算法公司等提供专业的AI数据解决方案。年,爱数智慧的营业收入接近亿元。
同时,近两年来,毕马威、华为、百度、亚马逊、英特尔等大厂人才纷纷加入爱数智慧。尤其是今年6月,前华为资深销售总监张涛也正式加盟爱数智慧任合伙人兼销售副总裁。
正值爱数智慧成立5周年,创业邦独家采访了爱数智慧创始人兼CEO张晴晴、合伙人兼销售副总裁张涛,深入解读对话式AI如何赋能企业数字化转型,以及女科学家又是如何蜕变成为一家AI数据服务公司的创始人。
女科学家曾为科研采集数据
立志为AI输送“原油”
从事语音识别研究已经17年的张晴晴,在最初接触到这个专业时可以说是兴趣使然。“语音信号数字处理”这门选修课,让她第一次萌生了对语音的兴趣。
后来在保研过程中,张晴晴看到中科院声学所在招语音专业的研究生,毫不犹豫立马报了名。最终,她在北邮通讯学院多个报名的学生中脱颖而出,以第7名的成绩保送到了中科院声学研究所中科信利语音实验室,师从中科院声学所首席科学家颜永红。
后来,张晴晴成为实验室中最年轻的副高,并且获得了年度中科院杰出科技成就奖,又在法国国家实验室攻读博士后,可谓一个妥妥的女学霸。
自此,如何构建更好的模型,让机器更好地理解人说的语音成为了她的研究目标。
张晴晴的博士论文研究的是中国人说英语的问题。她需要用个中国人说英语的语音进行训练模型,分析出中国人的发音特征,从而让机器用最适合的方式理解中国人说英语的特点。
为此,她收集了个人的声音,不仅包括亲朋好友,甚至她碰见走在大街上的路人,也会习惯的问一句:“您能帮我来录个音吗?”经过天的时间,张晴晴终于收集齐了这个人的声音,将所有语音进行清洗和分类,并把数据送到系统模型里,仅花费了1天的时间系统就给出了第一个实验结果。
天的时间,天都在收集和处理数据,张晴晴发现,像这样的现象并不是只有她一个人遇到,这是很多AI科学家共同的难题。在人们普遍印象里,AI科学家每天所做的工作应该都是在构建高大上的模型,但实际上绝大多数的时间都用在了与数据做挣扎上。
那么,有没有可能创造一个大型的训练数据集,来让所有科学家和企业都能够使用呢?这一想法在张晴晴的脑海中油然而生。
直到年,整个市场的时机逐渐成熟。张晴晴观察到BAT等互联网巨头对于数据的需求越来越多。实际上,在这几年,人工智能曾经出现过三起三落,张晴晴的大部分师兄师姐在毕业后也都转型到了其他行业。
在人工智能三驾马车中,数据是算法的基础,就好比原油,只有经过清洗、分类、标注、质检和筛选等结构化过程,才能用于AI模型训练。如果不从根本上解决数据的问题,人工智能在未来几年仍然会面临巨大的挑战。
作为一个人工智能从业者,她希望这一次的人工智能可以一直向前,不再衰落。也正是肩负着这样的情怀和理想,终于在同年11月,爱数智慧在北京正式成立。
经过五年的发展,公司已经从最开始10个人的小团队发展到多人规模。在这其中,有一件事始终让张晴晴印象深刻,直至今日,她也认为是创业过程中最大的挑战之一。
年,公司刚刚成立一年,为了节省成本,张晴晴只能租下在北京海淀区的一个商住两用楼的房间里办公。那段时间,北京大兴区的几场大火让存在消防隐患的办公楼都受到了波及。
一个周日的下午,消防队员走进大楼,公司被告知这个楼的消防不合规,需要当天晚上立刻撤走。当时,办公室里一共50个员工的办公物品,张晴晴需要在3-4个小时的时间里,把所有人的电脑、座椅、办公用品全部搬走。面对突如其来的打击,张晴晴仿佛无所适从。
“如果我是一个员工,听着我的老板打电话告诉我说我们要立刻搬家,员工会觉得这个公司很不靠谱吧,还要不要在这里继续工作?”这些话不由自主地浮现在了张晴晴的脑海里,开始忐忑起来。但她很快晃过神来:不可能以一己之力完成,需要求助团队的力量,马上告诉大家。
听到这个消息之后,所有员工没有一个人抱怨。50个员工仅用一晚上的时间就把所有东西搬到了新的办公楼里,第二天团队还面临着给客户交付数据。
第二天10点,所有人准时打开了电脑开始办公。而在那个时刻,公司还正在忙着A轮融资。投资人看到了整个过程以及所有人的凝聚力,毅然决然地投下了A轮。
“公司一路发展过来,几乎碰到了所有创业者都会遇到的问题,早期甚至有可能明天就发不出工资了。但好在我们一直坚信公司的目标和战略,如今终于迎来了人工智能行业的爆发。”张晴晴说。
据艾瑞分析《年中国AI基础数据服务行业发展报告》显示,年中国AI基础数据服务行业市场规模达到30.9亿元,其中语音类数据需求规模占比为39.1%,预计到年数据市场规模将突破亿元,年化增长率21.8%。
伴随着数据市场的爆发,今年年初,爱数智慧也已完成B轮融资。目前,公司已经处于AI语音数据服务行业的第一梯队,为全球超过家顶级人工智能企业提供相应的数据服务,而且规模也已经达到了上亿的小目标。
爱数智慧-融资历程
打造对话式AI三大基石
赋能企业数字化转型
公司成立之初,张晴晴就把她一直在研究的对话式AI(ConversationalAI)作为公司发展重点。在她看来,对话式一定是AI人机交互的终极形态,突破对话式形态代表着强人工智能时代的到来。
张晴晴之所以创立爱数智慧很重要的一点就是要把公司定位于AI人机交互这一场景,让人和机器可以以一种非常自然的方式进行交流。
从技术角度看,对话式AI涉及语音识别、自然语言理解和语音合成等技术,想要通过这些技术实现人和机器更自然的对话,面临着更大的难题。对话式口语常常会有语序颠倒,犹豫、迟疑产生的停顿,多人同时交流甚至出现语句打断、抢话、交叠音等复杂语音场景,这都为AI建模带来了很大困难。
目前,从数据行业看,行业提供的大部分人工智能数据都以朗读式训练数据为主,而人与人自然的对话式数据对训练对话式AI有更加关键的作用。“要想把机器训练成人,使得机器可以像人一样能够理解语言,这就需要我们为机器注入知识图谱、中文、方言、外语等等,这确实有很大的难度,但这正是我们意义所在。”张晴晴说道。
如今,AI训练数据集、数据智能化标注平台Annotator5.0以及MagicHub.