
云知声智能科技股份有限公司Unisound AI Technology Co Ltd (港交所:9678)成立于2012年,总部位于中国北京,是中国通用人工智能(AGI)技术产业化的先驱之一,云知声一直致力于语音识别技术和基于深度神经网络的声学建模相关的学术研究。
云知声智能科技 Unisound AI Technology Co(9678)美股百科
云知声是中国AGI技术的先行者,于2016年开始建立Atlas人工智能基础设施,并据此开发了拥有600亿个参数的专有大模型山海大模型,于2023年正式发布,成为公司技术平台云知大脑(UniBrain)的新核心。在云知大脑的赋能下,公司推出极具竞争优势的产品和解决方案,涵盖智慧生活和智慧医疗中广泛的AI应用场景。
目前,云知声的智算集群拥有超过184 PFLOPS的计算能力,以及超过10PB的存储容量。在过去几年UniCore的演进和优化的基础上,云知声于2023年推出了一个拥有600亿个参数的自有大语言模型山海大模型。相较UniCore,山海大模型具有更大的参数及数据规模、生成能力以及强大的多语言和基本知识能力。
云知声于2018年开发了Swift芯片,该产品融合了人工智能和物联网技术,被誉为首款AIoT芯片。Swift的开发得益于与百度以及科通芯城集团旗下子公司硬蛋的战略合作。据称,由于该芯片集成了深度学习和人工智能技术,其处理速度比市面上其他AI芯片快50倍。云知声的技术已应用于电视制造、空调生产、医疗保健和汽车技术等行业。
2024年,按收入计算,云知声是中国第四大AI解决方案提供商;按收入计算,云知声在中国生活AI解决方案排名第三,在医疗AI服务及解决方案排名第四。云知声已与北京友谊医院、北京协和医院、人保集团、深圳龙华区政府、南宁轨交集团、厦门机场、吉利汽车、比亚迪等龙头企业建立深度合作,成为业内首批在严肃场景下实现大模型规模化商业落地的企业。其解决方案不仅提升了行业效率,更通过AI技术的深度融合,驱动医疗诊断、交通管理、客户服务等领域的智能化变革。
财务数据方面。2022年至2024年,云知声的营收分别为6.01亿元、7.27亿元和9.39亿元,复合年增长率为25.0%;毛利分别为2.40亿元、2.95亿元和3.64亿元,复合年增长率为23.3%;同期,云知声的毛利率则分别为39.9%、40.5%和38.8%。今年第一季度,云知声的营收继续保持约25%的同比增长。
云知声智能科技 Unisound AI Technology Co(9678)核心技术
1、感知分析
(1)信号处理
基于阵列与深度学习技术,提供多场景高性能的人机语音交互与通话降噪功能。包括1mic、2mic、4mic、6mic、8mic及多种丰富阵型的远近场阵列处理方案,实现混响抑制、波束形成、回声抵消、声源定位、噪声消除等。在Interspeech2021噪声消除(DNS)与回声消除(AEC Challenge)评测中均获第二。
(2)语音唤醒、语音识别
云知声语音唤醒高时效、高唤醒率、低误唤醒率,支持one-shot及自定义唤醒词;语音识别技术安静环境下通用领域识别率 >97%。
(3)声纹识别
包含在线声纹识别(可支持十万级别声纹库快速检索)和离线声纹识别(响应延迟小于 500 ms),理想场景下识别准确率 >99%。
(4)面部识别
拥有全面自研的人脸信息分析能力,包括人脸检测与矫正,属性识别,人脸比对和搜索,多模态活体检测等;针对性优化复杂光照和遮挡场景,支持戴口罩人脸识别通行;在 MegaFace 等多个国际公开竞赛中跻身第一梯队水准。
(5)OCR
多种通用场景的高精度全图文字检测和识别,包括各类印刷文档、表格、票据、卡证等;总体识别准确率达到 99%,具备离线和在线批量识别能力,可用于纸质文档电子化、办公文档/报表/票证识别等场景。
(6)发音评估
基于语音识别和评价技术对发音做客观打分,反馈发音正误和定位问题。依托先进的神经网络算法,云知声口语评测的评测打分结果与人工专家打分拟合度在 95% 以上,拥有细分年龄段引擎,可多维度输出结果。
2、生成转换
(1)语音合成
基于深度学习和端到端的语音合成技术,可将文本实时、准确地转换为清晰、自然、流畅的语音,MOS 分可达 4.2,Blizzard Challenge 2020 多项关键指标第一名。提供离线和在线合成,多音色可选,20-300 句音库即可定制个性化音色。
(2)语音图像融合
基于端到端的机器翻译技术,支持中-英、中-日、中-韩互译,WMT 2018 英中翻译第二名、中英翻译第三名。
3、认知决策
(1)语义理解
基于BERT的语义理解算法模型,少量训练语料即可达到92%的准确率,CPU解码耗时低于20ms;提供成熟的训练工具和闭环日志优化方案,具备高效的工业级NLU落地应用能力。公有语义云平台拥有95个通用技能,平均语义理解准确率94%。
(2)推理和决策
基于知识图谱的对话管理方案,具备灵活准确的流程驱动、省略指代消解和技能间跳转切换能力,对话管理准确率为98%;提供成熟的流程可视化拖拽编辑工具,具备高效的工业级对话流程设计与应用能力。
(3)知识图谱
大规模多源异构知识图谱构建与应用方案,具备低资源低成本知识抽取技术优势和敏捷构建的标准流程,并提供知识图谱全生命周期的管理平台和应用开发组件。基于知识图谱核心技术,《大规模知识图谱构建关键技术与应用》项目获得2019年北京市科技进步一等奖;获CCKS2020 医疗实体识别评测第一名、CHIP2019手术实体链接第一名。
4、算力
(1)智算平台(算力)
高性能计算平台。面向人工智能计算场景,支持主流 AI 计算框架,高效弹性异构计算与 PB 量级高性能海量存储,峰值计算能力达到八亿亿次每秒,提供私有化部署,助力用户提升 AI 计算效率。
(2)大数据平台(算据)
自研人工智能大数据平台,包含数据获取、数据标注与处理、数据治理、数据隐私与安全四大功能,具备处理 PB 级多模态数据的能力,助力人工智能算法升级迭代。
云知声智能科技 Unisound AI Technology Co(9678)港股投资
参考资料:


评论