人工智能

数据堂——基于human-in-the-loop智能辅助标注技术

ainet.cn   2019年08月22日

  自人工智能技术进入产业化后,对于训练数据的需求变得更为复杂和庞大。通过工业化的方式产生更多更大更适合应用的数据集就决定了人工智能产业是否能得到良性发展。

  数据堂在人工智能数据生产与服务领域7年的技术研发成果及实践经验积累,提出“人工智能数据工厂”的建设及产业化方案,以推动人工智能数据生产与服务的产业化进程。将实现从人工智能产业需求出发(From the AI),依靠人工智能技术(By the AI),最终为人工智能产业服务(For the AI)。

  2018年,数据堂研发“基于Human-in-the-loop智能辅助标注技术”,在海量人工智能数据生产过程中,采用人工标注与智能标注的迭代、交互式的数据标注方法,将人和智能系统融为一体,提高智能数据的生产效率,进而推进AI数据加工方式的变革。

  Human-in-the-loop在机器学习中得到广泛的使用。用户(user)和深度学习机器模型(model)进行交互、迭代的学习和纠错。用户为机器模型提供冷启动所需的基础知识;然后机器学习模型进行识别或预测;用户针对模型的判断结果进行确认和纠错;纠偏信息成为机器学习模型损失函数的一部分,进一步优化模型。由此,循环迭代、多次往复,形成增强型的基于human-in-loop的机器学习系统。基于human-in-the-loop增量式智能辅助标注技术,起始于人工标注,终结于人工决策。将能够显著提高人工操作效率,降低生产实施成本,扩大人工智能数据的生产量。

  数据堂在自主研发的“基于Human-in-the-loop智能辅助标注技术”智能标注平台的基础上,建设了人工智能数据工厂,一种人工智能数据产品的生产模式。它以人工智能数据采集、数据处理及数据标注等数据生产过程流程化、生产工具智能化、质量管理标准化的生产模式,实现面向公众用户提供人工智能数据的在线生产服务、面向企业用户提供人工智能数据的定制生产服务以及面向特殊用户提供人工智能数据的私有化部署生产服务,从而提高数据生产效率,降低数据生产成本,进而推动人工智能数据的规模化生产和产业布局。

  整个人工智能数据工厂具备强大的生产能力和市场适应能力,它能够同时具备生产主流AI应用所需训练数据集产品,包括无人驾驶、智能家居、智能认证、智能交通、智能教育、智能安防、智能医疗。

  目前,已经初步具备年产2千小时视频、3万小时语音数据、2亿张图片的生产能力;数据吞吐量:5TB/日;创造500万人次的就业机会,聚集数据企业200家,支撑多家国际领先的企业客户。获取专利14项,软著42项。

(转载)

标签:2019世界人工智能大会 数据堂 我要反馈 
泰科电子ECK、ECP系列高压直流接触器白皮书下载
亿万克
专题报道
2025全景工博会
2025全景工博会

第二十五届中国国际工业博览会(简称“中国工博会,CIIF”)将于今年9月23至27日在国家会展中心(上海)举行。 [更多]

智能制造标杆企业展播
智能制造标杆企业展播

为了讲述我国实体经济推进高质量发展的鲜活实例,发挥好典型企业实施智能制造的示范作用,提振广大制造业企业推进转型升级的信心... [更多]

2025世界人工智能大会
2025世界人工智能大会

2025世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC 2025”)将于7月在上海世博中心和世博展览馆举行... [更多]