随着信息技术的发展,智能语音技术已成为人们信息获取和沟通最便捷、最有效的手段之一。
据中国信息通信研究院数据显示,AI市场以48%年均复合增速发展,2020年将达到710亿元。其中,智能语音在中国人工智能市场中份额占22%,即48亿元。
目前,全球智能语音产业规模持续增长,中国智能语音市场依然保持垄断的竞争格局,科大讯飞和百度分别以44.2%和27.8%占据市场份额前两位。
整个产业链尚未成熟。在资本市场,准备登陆科创板的智能语音公司海天瑞声将面临怎样的机遇和挑战呢?
主营智能语音,来自BAT收入超四成
语言智能的发展将推动人工智能技术发挥更大的价值,目前,人工智能为行业热点,语言智能的发展促进了行业内的应用和创新。
海天瑞声业务领域从单一的智能语音技术,扩展为网络搜索、机器翻译、自然语言理解、图形图像处理等人工智能多个技术领域。
招股书显示,海天瑞声的主要产品及服务主要包括数据资源定制服务、数据库产品和数据资源相关的应用服务,覆盖多领域、多场景和多语种。
公开资料显示,海天瑞声成立于2005年,注册资本3000万元(人民币,下同),总部位于北京市海淀区,法人为公司董事长贺琳,贺琳毕业于北京大学计算机专业,曾在中科院声学所任职,一直从事语音识别、语音合成等相关技术的研究工作。
海天瑞声本次选择的上市标准为第一条,“预计市值不低10亿元,最近两年净利润均为正且累计净利润不低于人民币5000万元”。
公司希望通过不断升级数据资源产品和服务的范围与质量,使得数据对人工智能产业的推动力能够与算法和算力相匹配,赋能人工智能技术与更多行业实体经济的深度融合。
本次公司科创板上市拟募集资金7.25亿元。拟募资金用于投资“天籁”自主研发产品扩建项目、一体化技术支撑平台建设项目、研发中心建设项目、业务管理平台建设项目与补充流动资金。
财务数据显示,2016年至2018年,海天瑞声营收分别为8422.8万元、1.2亿元、1.9亿元;净利润与归母净利润相同,分别为1028.9万元、3414.9万元、6714.1万元。
公司主要客户包括人工智能产业链上的各机构,主要分为三大类;
一、大型科技公司,如阿里巴巴、腾讯、百度、微软、三星等;二、人工智能企业,如科大讯飞、商汤科技、云知声、海康威视等;三、各科研机构,如中国科学院、清华大学等。
报告期内,海天瑞声前五名客户较为稳定,2016年至2018年,海天瑞声向前五名客户合计销售额占当期营业收入比重分别为47.4%、51.2%及59%。
其中,2018年海天瑞声来自BAT的收入占总收入的比例为39.6%。
值得一提的是,海天瑞声面向单一客户的销售比例均不超过当期营业收入总额的50%,对比其他拟科创板上市公司,公司不存在对单一客户的依赖,从而这一方面对公司业绩的风险值将大幅减小。
研发投入过多,变现能力存疑
海天瑞声公司高管及核心人员均毕业于清华北大、中科大、复旦等院知名院校。海天瑞声董事会现有7人,除3名独立董事外,总经理唐涤飞为中科大硕士,副总裁志鹏(女)毕业于清华和剑桥,董秘兼CFO吕思遥毕业于北大和人大。
此外,海天瑞声另有3名高级管理人员和2名核心技术人员,均属清华、东大、复旦、北航、北邮等名校的高材生。
2016年至2018年,海天瑞声累计研发投入达到7437.4万元,平均年研发投入占收入比重为18.8%,研发费用中职工薪酬占比最高,2018年占比高达50.2%,金额为1374.2万元。
2018年,海天瑞声营收约1.9亿元,较2017年度增长61.8%;净利润为6714.1万元,较2017年度增长96.6%。
海天瑞声境外收入占比已近总收入的三分之一,申报材料显示,海天瑞声2016年境外收入占比36.7%,2018年这一数据为31%。
报告期内,海天瑞声的员工人数从97人增长至127人,整体增幅不大,但技术人员在公司内占据多数,以2018年为例,海天瑞声拥有技术人员57人,研发人员31人,占比高达69.29%,近7成人员属于技术员工。
与此同时,公司2018年底统计数据显示,海天瑞声的员工全部接受过高等教育,其中硕士占比为34.6%,本科占比为60.6%,合计占比超过95%。
2016年至2018年,海天瑞声的研发费用占收入的比例分别为25.8%、21.2%、14.2%,研发占比正在逐年降低,但与其他拟登科创板企业相比,公司三年内研发占比平均值为18.7%,整体研发费用较高。
报告期内,海天瑞声主要产品及服务的销售收入情况如下:
报告期内,数据资源定制服务及数据库产品为发行人主要的收入来源,但收入贡献占比较低。
对此情况,海天瑞声副总裁程显峰表示,由于技术的发展,研发高质量语音系统所需要的基础数据资源量非常巨大,因此只有实力强大、资金雄厚的语音技术研究机构,才有能力获取大量的基础数据以及语音语料库资源,同时也有能力在技术创新上进行巨大投入,借助算法的提升,以提高语音识别的准确率。
程显峰称,广大的中小创业企业由于资金有限,在和国外语音巨头们的竞争中处于相对劣势,虽然国家在语音技术科研上的经费投入每年都在递增,但僧多粥少的格局,短期内还难以打破。
语音数据资源的短缺和数据质量参差不齐,仍然是国内市场广大语音行业企业面临的问题。
导致以上状况的主要原因是,数据资源生产方式并没有发生根本性的变革;数据采集和处理方法的局限性,导致数据生产效率不能得到有效提升、成本不能大幅降低。程显峰表示,高质量的语音技术科研基础数据资源的短缺,是科研成果产出数量和质量遭遇的瓶颈之一。
人工智能市场竞争加剧
目前,人工智能行业属于国家支持的战略行业,而人工智能数据行业位于产业链上游,处于快速增长期,具有较好发展前景。
数据、算力和算法是当前人工智能发展的三个核心要素,近年来,国内在人工智能算法和算力领域涌现出了一批新兴企业。一方面推动了行业快速发展,另一方面也导致行业竞争加剧。
人工智能技术从架构上分为基础层、技术层和应用层。
海天瑞声所提供的人工智能数据资源产品及服务隶属于人工智能产业链的基础层,是自主研发人工智能技术的企业与机构必需的基础生产要素,其数量多寡和质量高低将会直接影响到人工智能产业链内企业的研发周期、产品性能和可扩展性。
海天瑞声现为中国智能语音产业市场份额前十企业,但相对其他公司而言,公司资金实力较弱、融资渠道单一,难以满足未来高速发展所需的大规模资金需求,需积极拓展多种融资渠道,以满足公司业务发展的资金需求。
除海天瑞声外,人工智能数据资源开发及服务行业中的国内企业主要有慧听科技、标贝科技等,国外企业主要有 Appen 等。
慧听科技、标贝科技均为非上市公司,关键业务数据及财务指标均未披露。Appen 成立于 1996 年,面向机器学习和人工智能开发高质量人工标注数据集,已于 2015 年 1 月 7 日于澳大利亚证券交易所上市。
云知声董事长、CTO梁家恩博士表示,在AI大潮退去之后,技术的产业化能力成为了决胜的关键。技术如果不能解决产业问题,那么技术将化为企业“炫技”的产物。
梁家恩以当时最热门的智能语音举例称,经历了两年的市场教育后,语音交互技术被广泛应用到各大场景中,成为了AI技术落地最典型的应用案例。
然而在实际使用中,AI需要面对的情况比实验室中要复杂得多,一旦产品软硬件的某一环处理不好,便容易出现“听不到、听不懂、答非所问”等问题。
而AI技术方案必须能够确实、有效地解决产业规模化痛点,为终端用户提供相对成熟的用户体验。梁家恩表示。
海天瑞声一旦在科创版上市,若不能持续有效地保持技术、产品和服务的领先性,同时,将科技成果转化为利润,会遭到投资方的压力。
而作为科创板已受理企业中唯一一家智能语音公司,海天瑞声在众多重要指标中都保持着极大的优势,但如何在短期内转化为营利收入,尚待观察。