Files
authority-data/data.md
yiliyas ba98a5fa41 Add files via upload
update 上海疫情供保企业
2022-04-24 13:52:34 +08:00

9.4 KiB
Raw Blame History

官方权威统计数据更新日期2022-4-22

中国统计年鉴 :+1::+1:👍

http://www.stats.gov.cn/tjsj/ndsj/


全国年度统计公报 :+1::+1:👍

http://www.stats.gov.cn/tjsj/tjgb/ndtjgb/


中国互联网络发展状况统计报告 :+1::+1:👍

http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/index.htm


工信数据(工业和信息化部)统计分析数据 :+1::+1:👍

https://www.miit.gov.cn/gxsj/index.html


中国政府网 :+1::+1:👍

http://www.gov.cn/shuju/index.htm


6. 中国信通院 :+1::+1:👍

http://www.caict.ac.cn/kxyj/


7. 财富FORTUNE 500强 :+1::+1:👍

500强数据


8. 上海数据 :+1::+1:👍

😄 最新-2022-03-15 2021年上海市国民经济和社会发展统计公报

😄 2021年上海统计年签公报

>>疫情相关<<

新闻发布 日期
4月22日0-24时本市各区确诊病例、无症状感染者居住地信息 2022-04-23
上海2022年4月22日新增本土新冠肺炎确诊病例2736例 新增本土无症状感染者20634例 2022-04-23
商务动态 发布日期
本市疫情防控生活物资保障企业查询库上线啦 2022-04-18
全市部分已恢复线下开门营业的品牌餐饮、便利店、商超卖场网点目录4月19日更新 2022-04-20
上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(七) 84家 2022-04-20
[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(六)欠缺 ] 2022-04-1?
上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(五) 75~88 2022-04-17
上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(四) 62~74 2022-04-14
[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(三)欠缺 ] 2022-04-1?
上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(二) 21~42 2022-04-11
[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(一) 欠缺 ] 2022-04-?

9. 数据报告 :+1::+1:👍

😄行业分类报告-24个分类

😄行业年度报告-2012年——2022年


10. AI公开数据集^^最好的在最后^^ :+1::+1::+1::+1:👍 五星强推!!!!!

类别 名称 数量 说明
自然语言 Question Pairs 58.7MB 第一个来源于 Quora 的包含重复/语义相似性标签的数据集。数据集由超过40万行行的潜在问题的问答组成。每行行数据包含问题ID、问题全文以及指示该行行是否真正包含重复对的二进制值。
MS MARCO MS MARCO是一种新的大规模阅读理理解和问答数据集。 在MSMARCO中所有问题都是从真正的匿匿名用户查询中抽取的。使用先进的Bing搜索引擎版本从实际的Web文档中提取数据集中的答案的上下文段落。
图像类 Open Images Dataset V4 9百万 其中包括大约9百万标注图片、横跨6000个类别标签平均每个图像拥有8个标签。该数据集的标签涵盖比拥有1000个类别标签的ImageNet具体更更多的现实实体可用于计算机视觉方向的训练。
MNISTImage processing data set 约50MB,10大类70000张图像 这是一个手写数字数据集,包含一个有着 60000 样本的训练集和一个有着 10000 样本的测试集。对于在现实世界数据上尝试学习技术和深度识别模式而言,这是一个非常好的数据库,且无需花费过多时间和精力力进行行数据预处理。
音频类 FMA 689种 该数据集是免费音乐存档FMA的转储这是一个高质量量的合法音频下载的互动库。这些数据集中包含歌曲名称、音乐类型、曲目计数等信息共计689种歌曲和68种类型。该数据集可用于音乐分析。
TED-LUM 21GB TED Talk的音频数据集包含1495个录音和音频会议、159848条发音词典和部分WMT12公开的语料料库。
视频类 YouTube-8M 35万小时 YouTube-8M一个大型的多样性标注的视频数据集目前拥有610万的YouTube视频链接、35万小时视频时长、2.6亿视频/音频特征、3862个分类、平均每个视频拥有3个标签。统计时间2018.11.9
COCO COCOCommon Objects in Context是一个新的图像识别、分割和图像语义数据集由微软赞助图像中不不仅有标注类别、位置信息还有对图像的语义文本描述。COCO数据集的开源使得近两、三年年来图像分割语义理理解取得了了巨大的进展也几乎成为了了图像语义理理解算法性能评价的“标准”数据集。
Logo类 WebLogo-2M Dataset 178.1GB 194类2190757张
TopLogo-10 Dataset 78.5MB 10类
综合类 UCI 400 UCI数据集中包括了了众多用于监督式和非监督式学习的数据集数量大概400多个其中很多数据集在其他众多数据工具中被反复引用例如Iris、Wine、dult、Car、Evaluation、Forest Fires等。
SNAP 斯坦福网络分析平台SNAP是一种用于分析和操纵大型网络的通用高性能系统其本身使用的网络相关数据也对外开放包括设计、社区、通信、网络图、互联网、道路路、维基百度网络、在线社区和评论等不不同主题可用于分析大型社会和信息网络方面的研究成果。
  • ml机器学习数据集

  • dl深度学习数据集

  • 大学开放数据集