36氪首发 | 做AI行业的送水人, 数据服务平台「龙猫数据」获 3370 万元A 轮融资

2017年11月7日 | By News | Filed in: News.

http://ift.tt/2iCE7WL

36氪获悉,AI 数据服务平台「龙猫数据」宣布完成 3370万人民币A 轮融资,本轮由金沙江创投领投,九合创投、不惑创投(原真顺基金)继续跟投。此前龙猫数据曾获得九合创投、云天使天使轮及真顺基金Pre-A轮投资。本轮融资主要用于:加大研发投入,适应更多数据类型的采集标注,健全数据生产机制;提高服务能力和服务范围,比如医疗数据标注、小众人群采集、国外语音图像采集等。

龙猫数据上线于 2016 年初,其核心业务是为 AI 及大数据领域公司提供数据采集、标注等定制化数据解决方案,服务领域涵盖图像、语音、文本、视频四个方面。目前,龙猫数据旗下拥有众包平台「龙猫众包」,包括移动端APP、PC端标注网站等。官方表示,目前用户量达到百万级,可承担千万人以上样本量,为客户节约至少 50% 数据成本,是国内可调动数据处理人员最多、结果最精准的 AI 数据服务平台。目前,龙猫数据长期合作伙伴包括:百度、腾讯、小米、今日头条、蔚来汽车、升哲、出门问问、猎户星空、Advance、图森、下厨房、深鉴、Remo、YI+、西井、博云、云从、Video++ 等一系列国内领先科技公司。

具体业务方面,图像采集、标注是龙猫数据的第一大业务,龙猫数据提供的解决方案可广泛应用于计算机视觉、智能驾驶、智能安防、电商/新闻平台等多个领域,包括但不限于人脸图片、手势识别、各类车牌、商超 SKU 分类,以及车道线、车辆行驶区域标注、车辆行人 2D/3D 拉框、3D 点云等。龙猫数据告诉36氪,公司曾为多家无人车研发公司提供标注服务,积累了一批优秀标注员,每天可对数十万张图片进行标注。

语音/语义识别也是公司重要的业务之一。这方面,以语音交互智能硬件为例,龙猫数据已为多家相关公司提供语音录制服务,短时间内交付数十万人声样本,并且 100% 审核,大幅提高了客户研发进展。除此之外,龙猫数据还可提供语音转写 ASR,语义标注 NLP 等定制化服务。

当前,人工智能行业快速发展,以深度学习为代表的算法在诸多领域被逐渐应用,对优质数据,尤其是优质一手数据的需求量快速增长。当前,这些“有价值”的数据往往很难依靠市场上的“公开数据”获取,因而为做数据服务的公司提供了新的市场机遇。

专家预测,2018年,62%的大企业将会使用人工智能技术。Tractica预测,2024年人工智能市场规模将增长至111亿美元。基于乐观的市场前景,这一领域也出现了不少服务商。国外方面,亚马逊推出众包数据平台 Amazon Mechanical Turk,初创公司方面有CrowdFlower、Mighty AI等。国内方面,百度推出数据众包平台;成立于1998年的“海天瑞声”去年开始业绩有了大幅提升;成立较早的“数据堂”已经成功挂板新三板,2016年年收入达到9680万元,毛利率达到39.68% ;泛涵科技已完成融资;BasicFinder已于今年3月完成一千多万元pre-A轮融资;爱数智慧2017年初获得明势资本Pre-A轮融资,预计今年订单数量将达到千万元以上。 

行业玩家众多,竞争不可避免。龙猫科技认为,公司的优势在于依靠千万级数据采集处理能力,构建了一整套高效健全的系统,从精度、速度、安全性三方面确保了数据结果。精度上,龙猫数据平台目前拥有多重审核机制,包括标注、审核、抽检,多人交叉验证,专业考核及线下培训等,并仍在不断完善。速度上,龙猫数据依托龙猫自有 APP 平台数百万 C 端标签用户,可实现根据需求实时调配人员,任务反应迅速。安全性方面,龙猫数据支持将标注系统直接部署在客户服务器上,不在自身服务器留存,解除了客户对数据安全的顾虑。

数据服务行业,重人力的劳动密集型行业。这类公司的关键点就在于——人员效率、交付质量。一般来说,目前市面上主要有众包和自营两种模式。自营模式较容易保证质量,但往往交付效率不高;众包模式效率高,但为保证质量后续质检要求高。

采用众包模式,龙猫数据的难点就落在了保证质量上:外部需要客户认可数据服务质量;内部需要提升质检的效率,降低运营成本。龙猫数据采用了「免费试采试标-后付费」的模式,合作初期免费为客户提供采集标注服务,正式合作确认后客户验收数据完毕可再付款,提升客户信任感。在质检的机制方面,数据质检应客户的需求,分初审、复审、抽审等多个步骤,为了提高质检效率,团队会针对每个项目,筛选培养一批用户审核团队来进行初审,初审中会采用交叉验证等机制来确保审核质量。

 对于这一波因为深度学习而兴起的数据服务商来说,最大的潜在威胁很可能并非来自竞品,而是来自于增强学习、迁移学习等算法,后者仅需要少量的数据即可以达到一定的效果。龙猫数据表示,公司也在不断关注技术的进展,新的技术成熟后也会积极进行业务的调整。

龙猫数据团队目前有33人。 CEO 昝智拥有 7 年互联网产品经验,曾任豌豆荚商业产品负责人、百度联盟产品经理;CTO 姚毅曾任豌豆荚游戏频道技术负责人,Google、中兴工程师,并是点心(百度收购)创始团队核心人员。

IT.数码

via 36氪 http://36kr.com

November 7, 2017 at 08:34AM


发表评论

电子邮件地址不会被公开。 必填项已用*标注