上海2022年3月17日 /美通社/ -- 近日,全球领先的专业市场调查机构IDC,分析了企业在人工智能应用开发的建设现状及在数据服务方面的挑战和需求,并发布调研报告称:澳鹏Appen作为一家全球领先的AI训练数据服务提供商,在中国市场提供覆盖AI全生命周期的数据解决方案,具备独特优势。

中国AI市场快速发展,各行业AI落地的渗透率在逐步提高。 企业采用AI的过程中,存在隐私问题和数据缺乏等挑战,对数据服务的需求正在发生巨大变化。 企业越来越重视AI数据以加快AI落地,对AI数据服务的需求越来越聚焦在质量、效率和安全。 澳鹏Appen作为一家全球领先的AI训练数据服务提供商,在中国市场具备独特优势,为企业提供AI生命周期中图像、文本、语音、音频和视频的全栈式采集和标注服务及解决方案,其产品提供成品数据集产品和智能数据标注On-Promise/SaaS/Hybrid平台来积极满足客户的各种需求,在外语类和自动驾驶数据服务领域优势突出。

聚焦中国人工智能市场,数据是关键

近几年,中国人工智能市场迅猛发展,对丰富而优质的数据源的需求日益增加,成为AI数据服务市场的重要驱动力。据IDC预测,到2025年,中国人工智能市场整体规模将达到163亿美元,五年CAGR将超过美国,走在全球前列。

随着数字化转型进入深水区,企业对人工智能技术的探索从单点应用拓展到多个业务场景,从信息化进入更高级的智能化阶段。根据IDC调研,AI技术在互联网、汽车、金融、政府、制造、能源、医疗等各行业中均已有所渗透,且正逐步从业务流程的“提质降本增效”向经营的全面智能化演进。

然而与此同时,IDC在2021年的一项调研中发现,全球企业在AI部署的过程中,面临的三大挑战分别是:前期成本高、缺乏MLOps专业知识以及数据科学专业知识,紧随其后的是隐私问题,以及缺少训练和测试数据。

深度神经网络广泛进入行业应用带来了海量的数据需求,然而,在模型相对发展成熟后,通过继续优化模型代码带来的业务效果提升有限。因此,优化训练数据成为AI模型进一步大幅提升准确率的重要手段。

在这样的背景下,企业Al研发越来越注重将资源投入到获取高质量训练数据的工作,而不只是模型训练。IDC 调研发现,全球85%的受访企业表示花费了超过一半的人工智能开发投入用于数据准备。

MatrixGo高精度数据标注平台

针对以上市场需求和痛点,MatrixGo高精度数据标注平台是澳鹏Appen在进入中国市场后结合海外实践经验,独立自主开发的适配中国市场特性的平台产品。平台集成了丰富高效的标注工具、具备强大的工作流调度能力、通过对自有团队、供应商团队及百万级众包资源进行资源整合,可支持丰富场景海量数据的各种类型标注项目。

平台可通过私有化部署、SaaS服务、或混合云部署方式交付,确保数据流转合规,加强数据安全管控。平台将AI和模型能力有效地整合,以大规模人机协同的方式,支持海量数据采集、多语种多场景语音转写转译、3D点云目标跟踪和语义分割等功能,在各行业各领域为客户提供高质量的AI训练数据。

目前,澳鹏MatrixGo平台在2021年已经支撑和服务了中国130+客户,700+个项目,完成了各种类型的AI应用的采集和标注服务的交付。

最佳实践

公司以智能语音技术为核心,对数据服务的需求类型中超过一半的需求属于语音类数据采标服务,需求重点正在从成品数据集转向方言、小语种等定制需求,应用于家居、车载、医疗和教育场景。与澳鹏的合作中,在数据采标服务的标准方面,沟通效率高、响应速度快、质量评估结果好。 随着业务场景拓展,公司对数据服务的需求增长加快,在内部标注团队难以满足业务需求的情况下,我们于2021年开始与澳鹏合作。合作的数据标注服务覆盖NLP内容理解、AI助手语音识别、CV拍照影像等多个领域。澳鹏的业务覆盖全面,可满足各类业务需求,并在项目执行过程中,不断针对新流程积极解决问题、提升项目交付质量。

IDC分析显示,数据对AI的提升效果凸显,在AI应用开发过程中,企业的关注点正在从模型转向数据,需要更多的数据来帮助提升应用效果。另外,自动化正在成为数据服务的关键技术,可快速提升标注质量和效率。蓬勃发展的AI开发与应用正在为数据服务市场的发展带来无限机遇。

关键词: 数据服务 人工智能 生命周期