公司简介

数据计算能力

ETL:大批量数据的规则清洗:如数据输入输出、字段数值格式统一化、数据去重 ,以及使用 “数据解析能力”批量解析数据并存储至数据仓库
大数据存储:最大支持EB级数仓设计、搭建、维护
批量计算:支持复杂拉链任务定时计算 ; 实时计算:支持复杂的实时交叉计算
高速查询:支持百亿级数据交叉查询、支持简单运算、支持搜索引擎搭建

技术优势

大数据计算

保障数据及时性、完整性、易用性、准确性

实时分析:实时数据流计算分析
离线计算:离线数据计算分析
内容检索:内容索引/快速检索
数据清洗:去重/补全/标准化

文字OCR

识别准确

文字识别:提取图像中出现的文字(包括部分艺术字)
图片批处理:调整尺寸大小、压缩、合成、调色、马赛克、水印等
内容检索:定制化识别:定制的表格识别、指定图像特征&位置的图像信息提取、处理(如根据电商首图识别最低价、优惠券)

视频解析

识别准确

文字提取:视频画面中文字提取
语音转文字:将视频中音频内容转换为文字(自动断句,可自动填充标点符号)
视频批处理:压缩、合并、转码、抽取音频、截屏等
定制化处理:指定视频区域、时间 提取文字内容

NLP(自然语言分析)

识别准确

评论指标分析:可清晰辨别评论所讲述的维度指标(如外观、质量、售后等)
现有模型:涵盖电商平台90%主流类目的评论NLP模型、汽车垂直领域NLP模型
多观点提取:可将 一段评论、文章所讲述的多个观点 拆分并分别提取出对应的指标、正负面情感,支持正负面情感混合提取
定制化NLP分析模型:可指定产品类目、一二级指标结构、关键词、支持对现有模型的定制化调整

服务优势

特色服务

需求定制:OCR、视频解析、NLP 场景化定制、多项混合定制,支持定制化数仓、报表、数据平台,支持云端、本地化部署
快速稳定:模版和脚本引擎实现元数据抽取,信息抽取准确率高,精准获取数据范围。
准确:7*24小时稳定运作, 全天候服务、自动监控处理的技术, 支持横向扩展