• 需求概述:英文标签翻译
• 数据总量:200000万条(折合80万字)
• 工期计划:10个工作日
• 项目难点:数据量大、涉及行业多(医疗、军 事、植物等)
• 项目里程碑:项目按期交付,并总结出更高效完备的翻译流程,为二期三期项目奠定了基础。
• 采集信息:2000个中国人——人脸数据
• 采集设备:手机不低于800万像素,每个人脸照片不低于120*140像素
• 采集对象:2000个体,每人300张照片
• 采集环境:每年每人照片不少于50张,环境光线男女比例均匀分布
• 采集信息:“ xx同学”唤醒词采集、语音采集
• 采集要求:每人录制“xx同学”录制30次,其中慢速10次,中速10次,快速10次。要求发音准确。
• 采集设备:iphone5及以上型号,安卓要求支持支持6.0以上的机型
• 采集对象:人数要求1000人,男女比例平均分布,要求18-50岁之间,普通话要求标准,仅可带少许口音
• 采集环境:环境安静,没有杂音
• 采集设备:手机、行车记录仪
• 采集对象:道路中的车辆(机动车、非机动车)、行人、车道线、红绿灯、泊车位、交通指示牌等道路交通信息
• 采集环境:需涵盖白天、夜晚、市区、高速等场景,各类场景按需求满足比例
• 采集时长:14W小时,覆盖4个一线城市,25个二线、三线城市
• 针对给定的语音片段,人工判断其是否为有效语音,对于无效语音直接抛弃
• 按照切分-转写-保存的操作顺序进行标注
• 有效性语音判别、时间切分和文本转写需满足客户规范
• 图像来源:行车记录仪
• 标注目标:车辆、路障、路灯、可行驶区域、对向车道等
• 对应信息标签:标注目标的属性信息
• 标注方式:语义分割
• 输出结果:道路信息语义标注效果图
• 需求概述:对所有可见区域内规范内的对象进行标注,通过3D内形状与2D图片共同判定
• 数据总量:100000张
• 工期计划:此项目标注效率为1分钟/框,每张图15-20框,使用40人标注团队,工期2个月