2 数据获取 
参考资料:数据挖掘:(一)数据获取 | 博客园
数据获取的方式:
- 使用数据获取技术(如爬虫)发现,扩充或者生成数据
- 使用多种标记技术标记单个数据
- 改进现有数据质量或者改进已经训练好的模型
数据获取:
- 数据采集 - 数据发现 - 共享
- 检索
 
- 数据增强 - 推导潜在语义
- 实体增强
- 数据集成
 
- 数据生成 - 众包
- 数据合成 - 一般化
- 特定场景
 
 
 
- 数据发现 
- 数据标签 - 无标签 - 人工标注 - 众包
- 主动学习
 
- 弱标注 - 数据编程
- 实体抽取
 
 
- 人工标注 
- 比分标签 - 半监督学习
 
 
- 无标签 
- 现有数据 - 数据提升 - 数据清洗
- 重标注
 
- 模型提升 - 提升模型性能
- 模型蒸馏
 
 
- 数据提升 
