海天瑞声研究报告:国内领军数据服务商,人工智能产业卖铲人
数据服务商直接受益于人工智能产业发展,人工标注短期仍不可替代。自动化标注技术在现阶段还存在一定的局限性,如对某些类型的数据的识 别准确率不高、对复杂场景的处理能力有限等。对于一些需要专业知识判断的标注任务,如医学影像标注、法律文本标注等,人工标注能做出更准确、合理的标注。大模型领域的发展对数据服务提供商主要的推动力包括:(1)预训练阶段,需要数据服务商提供大量的原始数据;(2)强化学习阶段,大模型的对齐需要数据服务商提供调优、反馈等服务;(3)应用阶段,企业需要针对自身业务特点和需求训练专用的小模型,需要数据服务商提供专业化、全流程数据服务。