AI智能
改变未来

「觉醒向量」打造标准化数据标注系统,为AI海量数据应用铺路


根据上下游关系,人工智能产业链条主要有“数据”、“算力”、“算法”三层。每个人工智能产品的落地,都需要经过三层的推进,最终实现“计算机视觉”、“语音处理”、“自然语言处理”等具体的应用。
 
在算力和算法层面,已经有了诸多的标准化解决方案,譬如百度云、阿里云、TensorFlow、飞桨等。然而在“数据”层面,如何准备海量数据,目前行业仍没有通行的独立标准化方案。
 
根据觉醒向量CEO杨洋介绍,目前市面现存数据处理产品,多是系统化人工智能方案的一部分,而较少有单独的解决方案。而许多企业则对独立的数据处理平台有需求,从而更有针对性地利用成熟的算力+算法产品,解决相关问题。
 
成立于2018年3月,觉醒向量专攻AI的数据处理,打造数据处理平台、助力各类人工智能方案高效开展。
LabelHub图片标注、质检、验收界面
 
目前,在企业自主开发方案过程中,不可避免的会遇到数据准备的难题。数据准备流程包含了筛选、清洗、标注等诸多阶段,数据量众多、步骤繁杂,同时涉及人力上的部门与人员配合,因此现存的解决方案有较大提升空间。
 
觉醒向量认为,此外现存市场上存在诸多痛点:其一,许多企业对数据保密性要求较高,他们对通用的方案平台往往存有顾虑。其二,数据准备流程没有一款标准化平台提供给需求者,现存的方案较为粗放、效能不足;其三,目前中国市面上,可见的针对数据处理的软件较少,国产化需求高。
 
针对上述痛点,觉醒向量提出了TDM系统(Training Data Management,训练数据管理)的概念,希望利用标准化的平台,加速行业的数据处理标准化进程,目前旗下已推出了AI数据处理系统LabelHub产品,该产品主要用于数据处理流程中,对项目、对人员的综合管理。
 
LabelHub系统能够实现图像标注、视频标注、3D点云标注与文本标注等综合功能。并内含多个模块:在项目管理模块,新建项目并实现实时跟踪进度,定期生成报告从而及时反馈项目进程;在人员管理模块,根据数据处理要求,指派标注员、审核员、组长等角色,并统计系统内人员的完成情况、正确率等信息;在数据管理模块,实现数据集上传、常见格式导出。
 
其中,系统有绩效管理、模板管理、标注协作等多项特色功能。绩效管理能够及时统计角色工作完成情况,提供绩效的排名,从而加强团队进度的管理。同时,系统内部集成了诸多模板,依据不同项目选择合适的模板,从而提升效率。标注协作功能则是觉醒向量平台提供专业标注团队,用一支训练有素的标注队伍、达成高效标注任务目的。
 
在业务流程上,由如下步骤展开:
 
首先,总管理员上传数据、创建项目,指派人员角色、分配任务、自定义标注模板,并实时监督人员的绩效。其次,由数据标注员执行标注任务。接着,质检员执行质检,打回不通过的任务。最后总管理员导出数据,从而给到下一步处理流程。
LabelHub项目管理界面
 
针对不同客户的需求,LabelHub系统可以私有化部署、SaaS、定制化开发三种方式使用。私有化部署业务主要在国内展开,针对企业对隐私顾虑的痛点,将整体方案在客户企业本地化安装完成。而SaaS服务则主要面向觉醒向量的海外业务。定制化开发则主要针对有具体要求的企业,按需提供多种功能。
LabelHub图片标注、质检、验收界面
 
杨洋介绍,目前LabelHub客户主要分为人工智能企业、正在应用人工智能实现业务提升的传统企业、智能化改造集成商三大类。
 
在汽车领域客户案例中,某车企自动驾驶研发部门想要实现标注道路图片中的障碍物、汽车2D框注等功能,并根据其数据安全需求自建了标注团队。然而在实施过程中,出现了人员效率不足、难以监督绩效等问题,同时,由于缺乏工具平台,图片分发错误时有发生。
而在使用了LabelHub后,管理员使用了周报、月报功能实时监督,团队整体效率从而得到提升。月产出数量由73万升至75万张,同时人员数量由此前的110人减少到80人,整体人力开支降低了36%
 
此外,LableHub已经有电力、船舶等大型企业客户,他们对质检的视觉人工智能方案存在需求。由于此类企业体量较大、涉及部门庞杂,旗下的应用场景多,因此涉及数据繁杂而庞大。
LabelHub为他们提供了一个较好的集约化数据处理平台。同时,很多用户对于自身数据安全较为重视,因此LabelHub私有化部署的方式能够给到客户最大自主权、打消他们对数据安全的顾虑
 
据悉,按照三种部署的方式的不同,LabelHub分为一次性部署费用加上后续服务收费,SaaS则按年费制收费。
目前,除了上述举例多家大企业客户,总体客户量也在稳步增长中。在市场分野上,LabelHub计划将本地化部署主要应用于国内的大企业,而SaaS则主要用于进一步拓展海外市场。杨洋告诉创业邦,公司2020年的营收预计破千万人民币。
 
在团队上,CEO杨洋毕业于加拿大Ivey商学院,在北美有超过10年的工作经历,先后就职于Morgan Stanley和加拿大蒙特利尔银行的投资银行部门。
CTO易呈曾就职于中科院生态与理化技术研究所,拥有超过10年全站产品开发和管理经理,多次参与国有集团公司系统软件从0到1开发历程。
 
杨洋告诉创业邦,公司目前正在寻求500万人民币的天使轮融资,希望在合适时机与对人工智能有兴趣的投资机构合作。
点击小程序,查看项目详情
图片来源:觉醒向量
本文作者:杨飘,专注于前沿科技领域初创企业报道,采访、合作需求欢迎联系微信:13510191710,请注明单位与来意。
点击视频号查看更多DEMO CHINA创新中国秋季峰会动态。
MORE | 更多精彩文章

最高售价1.8万!Mate40终登场,搭载华为史上最强芯片,“麒麟绝唱”会成真吗?

IPO后市值或超千亿美元,Airbnb逆流而上成为新黑马?|海外头条

重庆首富一家被调查,负债近200亿面临破产,95后孙女接盘?| 撩车

上市首日大涨118%,金龙鱼真的是下一个茅台吗?

靠“十元店”起家,创始人身家超300亿,曾公开叫板马云,名创优品赴美上市


赞(0) 打赏
未经允许不得转载:爱站程序员基地 » 「觉醒向量」打造标准化数据标注系统,为AI海量数据应用铺路