|
海天瑞声(688787)经营总结 | 截止日期 | 2024-06-30 | 信息来源 | 2024年中期报告 | 经营情况 | 四、 经营情况的讨论与分析 2024年上半年,受益于大模型技术的快速革新以及各国政策的持续推动,全球人工智能产业驶入加速发展轨道,国内外科技巨头持续加大人工智能领域投入,受此带动,相关训练数据需求快速增长。为更好拥抱新一轮市场机遇,公司持续加大全球市场投放力度,通过品牌升级、营销推广等多元化战略积极拓宽海外市场空间,带动境外业务收入强力复苏。此外,公司不断拓展智能驾驶服务能力边界,抢抓车企出海机遇,积极探索布局境外数据采集业务;同时继续保持有竞争力的研发投入,持续优化迭代智能驾驶数据处理平台以及智能化标注能力,以更好适应以BEV技术为主、稳步向OCC技术方向探索的高阶智能驾驶技术需求。与此同时,受益于多模态技术的发展,大模型业务板块收入快速提升,成为继智能驾驶业务后公司又一重要的增长引擎。受上述各项积极因素带动,公司整体营业收入实现同比增长。 此外,由于标准化数据集产品收入占比大幅提升,同时公司整体数据交付能力在管理能力、平台技术提升、供应链进一步整合和扩展等因素的共同推动下,使训练数据定制服务的毛利率也同比显著增长,共同驱动公司整体毛利率增加至70.34%。同时,在研发投入方面,为积极应对产业需求的新兴变化,公司继续在大模型数据领域进行研发投入,但随着首发募投项目的结项,公司在传统深度学习数据集建设等方向已达到阶段性成熟状态,整体研发投入强度呈现自然回落;同时,在销售及管理投入方面为进一步提升整体运营效率,公司进行了资源的合理配置和流程优化,使得销售费用以及管理费用有效降低,以上因素共同驱动公司上半年净利润大幅增长,实现扭亏为盈。 报告期内,公司实现营业收入 9,242.64万元,较上年同期增长24.13%;归属于母公司所有者的净利润41.64万元,较上年同期增加1,765.78万元 ;归属于母公司所有者的扣除非经常性损益的净利润为-367.58万元,较上年同期增加1,942.87万元;经营性现金流净额1,567.69万元,较上年同期增加3,955.06万元。截至报告期末,公司总资产为7.88亿元,归属于母公司的所有者权益为7.53亿元,分别较期初减少4.45%和3.70%。2024年上半年公司具体经营情况如下: (一) 核心业务板块经营情况 1. 训练数据全球化业务 2024年上半年,受益于大模型技术的快速发展以及应用领域不断拓展,以智能终端厂商为代表的科技巨头纷纷加大多模态数据投入,全球数据服务市场持续增长。在此背景下,公司凭借多年来在语言研究以及自然语言方面的技术积累、以及全球领先的标准化数据集储备,进一步赢得了境外客户信赖。与此同时,《促进和规范数据跨境流动规定》等法规出台,为数据出境提供了更为高效简明的路径。截至报告期末,得益于行业发展以及政策环境的改善,公司境外业务收入较上年同期显著增长50.00%至4,369.53万元。此外,为更好把握行业机遇、进一步扩大全球客户辐射范围,公司从体系搭建、市场研究、品牌升级、营销推广等多维度提升业务、客户触达及服务能力。报告期内,公司持续加强境外销售团队建设,进一步织密客户服务网络;同时,通过参与包括Web Summit Qatar、ICASSP、AI EXPO TOKYO、Autosense and InCabin及CVPR等全球知名行业及学术顶会,以及布局搜索广告投放、社交媒体矩阵等多类宣传渠道等方式,向全球市场展示公司先进技术实力及创新产品,提升行业影响力和美誉度。2024年上半年,公司全新发布海外官网,全面升级官网服务模式,通过搭建marketplace,便捷用户目标服务/产品的选择,有效提升新客户拓展以及订单转化率。截至报告期末,公司境外客户数量已超过250家。2. 智能驾驶行业数据服务业务新能源汽车已成为国家发展新质生产力的重要抓手。政府工作报告中明确提出要巩固和扩大智能网联新能源汽车产业的领先优势,并在后续通过持续的立法支持、政策引导和投资激励等一系列措施,加速推进智能网联汽车的技术发展和商业化应用,推动行业进入新一轮的加速发展期。同时,从消费者角度,越来越多的购车客户更关注汽车的智能化水平。根据相关消费者调研结果,乘用车的智能化水平是影响购车的第二大因素,仅次于价格。 2024年上半年,为更好抢抓智能驾驶行业机遇,同时应对更为复杂的数据处理需求,公司加大了对高级别数据标注工具的研发力度,截至报告期末,DOTS-AD平台新增3D动静分离标注工具,BEV多图层4D车道线标注工具,并升级点云分割工具支持连续帧叠加标注和4D分段加载等核心能力,有效支撑了自动驾驶BEV和OCC主流算法演进对数据标注工具的需求。此外,公司不断优化算法中台中枢能力,开发了2D-3D融合的动静分离检测追踪算法,在点云连续帧融合产线实现提效30%以上,迭代优化点云分割算法和地面检测算法,在点云分割产线实现提效20%以上。此外,为进一步支撑我国车企的国际化战略,公司在全球范围内扩展了道路采集业务,可提供包括采集方案设计、采集人员组织、车队管理、车辆改装及数据清洗与脱敏等在内的全链条服务。截至报告期末,公司采集业务已覆盖包括德国、西班牙、捷克等多个国家,为公司构建智能驾驶全球化数据服务能力奠定了基础。3. 大模型数据业务随着大模型技术的持续突破,人工智能行业迈入加速发展期。数据作为驱动技术进步和构筑竞争壁垒的关键要素,价值更加凸显,相关数据需求快速增长。报告期内,公司通过大模型数据集产品及定制数据服务,服务客户从预训练、后期预训练、至指令微调、对齐、评测等全链条,服务范围已逐步覆盖至主要大模型厂商和研究机构。报告期内,公司持续加大大模型数据方向的研发投入,增厚大模型领域的数据储备,已完成并持续建设包括“大语言模型中文对话预训练数据集”、“语音大模型(声音复刻、歌曲)微调数据集”、“语音大模型(多语种)预训练及微调数据集”、“视觉大模型(图像-文本)预训练及微调数据集”、“视觉大模型(视频-文本)预训练及微调数据集”等在内的多领域大模型数据集。同时,针对大模型在特定行业的应用需求,公司重点开发了医疗、金融、法律、艺术等垂直领域的标注资源,形成垂直领域专家库,为公司提供高质量行业数据服务奠定坚实基础。与此同时,为更好理解大模型技术方向,报告期内,公司通过前瞻性研究,探索大模型数据的规模化生产方式,全面助力公司大模型业务的扩张。公司已和清华大学联合启动多语种语音大模型研发计划,该项目将基于最新的语音大模型框架技术,自研多语种数据清洗技术,训练多个不同规模的语音大模型,有效提升多语种语音数据处理的效率和准确性。公司的算法团队联合清华大学语音与音频技术实验室充分利用公司海量高质量语音数据集储备(超过200个语种/方言,近30万小时自有知识产权的语音数据集),充分发挥各自所长,促进大模型技术在数据生产领域的更深层次的应用。 (二) 核心技术能力建设情况 2024年上半年,按照技术+产品双轮驱动的定位,公司继续保持有竞争力的研发投入强度,不断提升技术和平台工具先进性、在大模型数据处理技术方向进行积极探索储备、巩固标准化数据集产品储备、增厚语音语言学基础研究领先性,持续巩固公司核心竞争力。报告期内,公司研发费用共计2,667.32万元,占当期营业收入的28.86%。截至报告期末,公司研发人员数量65人。 1. 算法及平台能力建设、大模型数据处理技术探索储备 报告期内,公司持续加大基础研发投入,进一步提升人工智能基础算法、一体化数据处理平台、前沿技术研发等领域能力;在智能驾驶数据处理综合性平台上继续提升平台能力,并落地更多面向智能驾驶数据预处理的相关算法;同时,在面向大模型预训练、微调、对齐及评测技术上持续保持技术探索、储备,推动相关领域的数据服务,并形成了一些代表性成果: 1.1算法智能语音领域,完成 Whisper推理框架升级、显存占用降低 59%、推理延迟降低 59%,新增ASR模型11个、语音识别算法支持语种数增至130+个,大幅提升了算法在实际项目中的降本增效能力。在计算机视觉领域,引入 Detzero-track、23DFusion-if 、centpoint、Lane-Marking-Detection、facefusion等有代表性的计算机视觉框架或算法,上线3D点云目标检测多模型融合算法、4D大点云车道线检测算法、GDINO-零样本目标检测等算法,优化2D细分类视频跟踪算法、2D异形红绿灯跟踪算法、4D车道线长度动态自适应调整算法等多个智能驾驶场景下的模型,并新增超过27种不同场景的视觉类算法预处理技术。在大模型算法领域,针对公司自有知识产权的语音数据集,设计通用的数据清洗、模型训练、模型评测框架,已完成数据清洗pipeline搭建,并初步清洗出通用格式的语音数据数十万小时,同时完成语音大模型训练所需要的算力集群搭建、算法框架研发、模型训练pipeline搭建等。针对视觉大模型应用领域,搭建了美学评分模型与图文生成模型相结合的自动标注算法,已在项目中应用,并取得了良好的降本效果。 1.2平台 公司在训练数据生产与管理的一体化平台建设方向精耕细作,展现了一系列里创新成果,具体可归结为以下核心维度: (1)重点推进以数据为核心的一体化平台体系建设,全面提升一体化数据处理平台数据处理过程柔性管理能力,实现了十余类核心预处理算法模型自动化对接、数据切片、数据加工处理管道的快速搭建与灵活编排,以及数据处理算子集成与统一管理,共计超40个功能点。 (2)实现贯穿数据采标、模型训练、模型效果展示全生命周期管理:重点优化多源多模态非结构化与结构化数据的标准化与一致性管理,以及点云与图像类算法模型对比与模型评测支撑能力。扩展了算法结果评测指标维度,提升算法结果可视化展示能力等超40个功能点,大幅提升公司对训练数据的一站式全生命周期管理能力。 (3)持续优化一体化数据处理平台的智能化工作流程革新,实现数据采集质控设置精细化调优,多语种多模态算法灵活扩展,自动化处理效果精准探查,跨平台系统集成与数据流动生态建设,以及人员管理与协作机制创新等共计超200个功能点,助力公司业务向智能化、工程化、平台化迈进。 通过上述投入,截至报告期末,公司共获得专利授权37项,获得登记的软件著作权173项。 同时,公司实质性地提升了自身的算法能力、工程化数据研发及生产能力,形成了更为合理、高效的人机协同智能化解决方案,持续降低训练数据开发成本,以AI赋能训练数据开发,以训练数据赋能AI产业发展。 2. 标准化数据集产品 标准化数据集产品,是公司区别于众多竞争对手以定制化服务为主的特有商业模式,也是公司核心竞争力之一,标准化产品不仅可以更好服务于客户需求,同时由于产品本身的知识产权由公司享有,具有一次性研发生产、可重复多次销售的特点,因此可更好帮助公司实现未来可持续性销售、以及毛利空间提升。 1、智能语音 个人助手、语音输入、智能家居、智 能客服、机器人、语音导航、智能播报、语音翻译、移动社交、虚拟人、智慧金融等 1,088个 个 2、计算机视觉 智能驾驶、移动社交、虚拟人、智慧 金融、智慧交通、智慧城市、OCR识别等 163个 个 3、自然语言 通用 AI大模型、机器翻译、智能问答、 信息提取、情感分析等 307个 个 合 计 1,558个 个截止报告期末,公司已向下游客户提供了累计超过8,000次/个定制或标准化训练数据集,可覆盖生活交流、客服、家居、行车、办公、普通环境、噪声等多种特定场景中的语言现象和视觉呈现,构建成独具特色的训练数据资源及服务能力集群,并已应用于个人助手、语音输入、内容生成、智能家居、机器人、语音导航、智能客服、智能播报、语音翻译、移动社交、虚拟人、智能驾驶、智慧医疗、智慧教育、智慧交通、智慧城市、智慧金融、机器翻译、智能问答、信息提取、情感分析、OCR识别等22类创新应用领域,赋能人工智能技术与实体经济的深度融合。3. 语音语言学能力随着全球化扩张、通用AGI成为头部企业收入持续增长的重要引擎,多语种数据的作用和价值更加凸显。为更好满足客户多语种拓展需求,公司持续保持语音语言学研究力度,在语音语言学基础研究方面,公司不断丰富合作语言学家团队资源,成员遍布世界各地的学校及研究机构,在语音语言学领域具备丰富经验和技术储备。截止报告期末,公司已经拥有超过205个语种/方言的覆盖能力,不仅包括含英、法、德、意、西、日、韩等常见语种,还包括东南亚、一带一路等国家地区的罕见小语种,尤其在亚洲小语种、中东欧小语种的服务上具备竞争优势。同时,公司建立了成熟的发音词典构建流程,公司已积累下超过130个多语种的发音词典,覆盖波斯尼亚语、塞尔维亚语、巽他语、尼泊尔语、奥利亚语、基隆迪语、茨瓦纳语、达利语等小语种,累计词条数超过1,200万条,可支撑构建高质量的智能语音、以及多模态训练数据,是公司的主要竞争壁垒及核心技术之一。 (三) 其他综合能力建设情况 1. 数据安全及合规 2024年上半年,中央和地方出台了一系列有关数据要素、数字经济的法律法规和政策,同时,《促进和规范数据跨境流动规定》等法规出台,都对企业的数据安全水准和能力提出了更高要求,也为企业在数据要素、人工智能等领域的发展提供了新的机遇。 公司一直以来非常重视数据安全管理以及相关能力的提升,并将其作为把握新发展机遇所必须练好的“基本功”。2024年上半年,公司在数据安全方面取得了多项工作成果。公司“AIGC训练数据业务的综合合规管理机制”案例荣获中国互联网协会首届“金灵光杯”中国互联网创新大赛企业合规赛道优秀奖。公司积极参与行业发展,提出立法建议、参与行业调研,数据安全能力获得广泛认可。 公司也一直坚持统筹安全与发展并重的原则,在守住安全合规底线的前提下积极拓展包括数据跨境流通在内的数据要素业务。 2. 供应链体系 2024年上半年,基于大模型需求的影响,公司重点开发了医疗、金融、法律、艺术等垂直领域的资源,通过与这些领域的专业机构及专家合作,增强了公司的供应链资源池,满足了特定领域的需求,提高了供应链的多样性和专业性。 除此之外,公司重点培养和发展战略供应商,与其建立了长期稳定的合作关系,加强了与供应商的风险共担机制,共同应对市场波动和不确定性。 公司也进一步优化了供应链网络,特别是在海外一手资源群体的扩展方面取得了重要进展。 通过建设大型数据基地及精细化管理资源池,供应链的多样性和稳定性得到了显著提升,为实现可持续性产能扩张和成本优化奠定了坚实基础。 在供应链管理体系建设方面,通过建立更细致的成本核算模型和流程监控节点,实现了对供应链各环节成本和效率的精准把控。同时,全面升级线上管理系统,实现了订单处理、资源配置和结算审批的一体化和实时化。 3. 人力资源 报告期内,公司完成销售、生产、研发体系的绩效管理机制优化,并对内部反馈机制及奖金核算机制进行迭代,以期增强绩效牵引力实现更加公平和富于激励性的管理效果。上半年公司组织多种类专项培训及人才发展项目,在大模型领域的探索与应用进行广泛深入的内部交流,组织销售、生产、职能等多体系的软技能培训,对应届高潜毕业生、新锐力量、中坚力量、中高层管理人员采取不同的梯队建设规划,以保障人才队伍的不断夯实。文化建设方面,强化高度敬业和持续创新文化,进行榜样之星等多样化的文化倡导和活动辐射,打造更加尊重信赖和追求卓越的组织基因。同时在人才引进方面,启动海外人才招募、研发专项人才和高潜毕业生吸引计划,引入多名欧美同业专家、优质研发人员、及卓越背景应届毕业生,充实销售、研发及项目交付队伍的人才密度,发展健康、可持续、多元化的人才队伍。 报告期内公司经营情况的重大变化,以及报告期内发生的对公司经营情况有重大影响和预计未来会有重大影响的事项
|
|