# 官方权威统计数据(更新日期:2022-4-22) ## 中国统计年鉴 :+1::+1::+1: http://www.stats.gov.cn/tjsj/ndsj/ - [数据下载](./data/data-tjnq.md) *** ## 全国年度统计公报 :+1::+1::+1: http://www.stats.gov.cn/tjsj/tjgb/ndtjgb/ - [数据下载](./data/data-tjgb.md) *** ## 中国互联网络发展状况统计报告 :+1::+1::+1: http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/index.htm - [数据下载](./data/data-internet.md) *** ## 工信数据(工业和信息化部)统计分析数据 :+1::+1::+1: https://www.miit.gov.cn/gxsj/index.html - [数据下载](./data/data-miit.md) - [原材料工业 —— 钢铁 有色 石化化工 建材 稀土 ](https://www.miit.gov.cn/gxsj/tjfx/yclgy/index.html) - [装备工业 —— 机械 汽车 民用船舶 民用航空工业 ](https://www.miit.gov.cn/gxsj/tjfx/zbgy/index.html) - [消费品工业 —— 轻工 纺织 食品 家电](https://www.miit.gov.cn/gxsj/tjfx/xfpgy/index.html) - [通信业 —— 基础电信业统计数据及运行分析 ](https://www.miit.gov.cn/gxsj/tjfx/txy/index.html) - [电子信息制造业 —— 电子信息制造业统计数据及运行分析](https://www.miit.gov.cn/gxsj/tjfx/dzxx/index.html) - [软件业 —— 软件和信息技术服务业统计数据和运行分析 ](https://www.miit.gov.cn/gxsj/tjfx/rjy/index.html) - [互联网 —— 互联网和相关服务业统计数据和运行分析](https://www.miit.gov.cn/gxsj/tjfx/hlw/index.html) - [网络安全 —— 网络安全信息与动态](https://www.miit.gov.cn/gxsj/tjfx/wlaq/index.html) *** ## 中国政府网 :+1::+1::+1: http://www.gov.cn/shuju/index.htm - [数据下载](./data/data-gov.md) *** ## 6. 中国信通院 :+1::+1::+1: http://www.caict.ac.cn/kxyj/ - [白皮书 271个 ](http://www.caict.ac.cn/kxyj/qwfb/bps/) [(下载)](./data/data-caict-bps.md) - [权威数据 479个 ](http://www.caict.ac.cn/kxyj/qwfb/qwsj/) [(下载)](./data/data-caict-qwsj.md) - [专题报告 196个 ](http://www.caict.ac.cn/kxyj/qwfb/ztbg/) [(下载)](./data/data-caict-ztbg.md) *** ## 7. 财富FORTUNE 500强 :+1::+1::+1: [500强数据](top500.md) - [全球排行榜](https://www.fortunechina.com/rankings/node_11663.htm) - [世界500强](https://www.fortunechina.com/fortune500/index.htm) 😄 [2021年《财富》世界500强排行榜](https://www.fortunechina.com/fortune500/c/2021-08/02/content_394571.htm) - [中国500强](https://www.fortunechina.com/fortune500/node_4302.htm) 😄 [2021年《财富》中国500强排行榜](https://www.fortunechina.com/fortune500/c/2021-07/20/content_392708.htm) - [数据下载](./data/data-t500.md) *** ## 8. 上海数据 :+1::+1::+1: - [上海统计公报](http://tjj.sh.gov.cn/tjgb/index.html) 😄 最新-2022-03-15 [2021年上海市国民经济和社会发展统计公报 ](http://tjj.sh.gov.cn/tjgb/20220314/e0dcefec098c47a8b345c996081b5c94.html) - [上海统计年签](http://tjj.sh.gov.cn/tjnj/index.html) 😄 [2021年上海统计年签公报 ](http://tjj.sh.gov.cn/tjnj/20220309/0e01088a76754b448de6d608c42dad0f.html) - [数据下载](./data/data-sh.md) **>>疫情相关<<** - [上海市卫生健康委员会](https://wsjkw.sh.gov.cn/xwfb/index.html) |新闻发布 |日期| |:----|:----| |[4月22日(0-24时)本市各区确诊病例、无症状感染者居住地信息](https://mp.weixin.qq.com/s/LySBR0VJswl_ZI1KtWlXqw)|2022-04-23 |[上海2022年4月22日,新增本土新冠肺炎确诊病例2736例 新增本土无症状感染者20634例](https://wsjkw.sh.gov.cn/xwfb/20220423/803d2f7447bc44118178241a80c9c73f.html)|2022-04-23 - [上海市商务委员会](https://sww.sh.gov.cn/swdt/index.html) 😄[(绿卡通行证企业大全——本地镜像)](./data/data-sh-yq.md) |商务动态 |发布日期| |:----|:----| |[本市疫情防控生活物资保障企业查询库上线啦](https://sww.sh.gov.cn/swdt/20220419/e4df759e135642ccb870382f873cb986.html)|2022-04-18 |[全市部分已恢复线下开门营业的品牌餐饮、便利店、商超卖场网点目录(4月19日更新)](https://sww.sh.gov.cn/swdt/20220421/3d9f4ba3fa064cdc856c789002332e4b.html)|2022-04-20 |[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(七) 84家](https://sww.sh.gov.cn/swdt/20220421/07589027c7724736a24dbd1d2080f393.html)|2022-04-20 |[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(六)欠缺 ]|2022-04-1? |[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(五) 75~88](https://sww.sh.gov.cn/swdt/20220418/597c7815918146a4aeab8563384e50d5.html)|2022-04-17 |[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(四) 62~74](https://sww.sh.gov.cn/swdt/20220415/7f4505aab76d4404ab067302638139cf.html)|2022-04-14 |[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(三)欠缺 ]|2022-04-1? |[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(二) 21~42](https://sww.sh.gov.cn/swdt/20220412/42ea72bcb8854138953aa3d1d2524344.html)|2022-04-11 |[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(一) 欠缺 ]|2022-04-? *** ## 9. 数据报告 :+1::+1::+1: - [艾瑞咨询——产业研究报告](https://www.iresearch.com.cn/report.shtml) 😄[行业分类报告-24个分类](./data/data-report.md) 😄[行业年度报告-(2012年——2022年)](./data/data-report-year.md) *** ## 10. AI公开数据集(^_^最好的在最后^_^) :+1::+1::+1::+1::+1: 五星强推!!!!! - [最全中文NLP资源库](https://github.com/fighting41love/funNLP) 😄[本地镜像](./data/funnlp.md) - 开放数据集(Open Dataset) |类别|名称|数量|说明| |:----|:----|:----|:----| |自然语言|[Question Pairs](https://data.quora.com/First-Quora-Dataset-Release-Question-Pairs)|58.7MB|第一个来源于 Quora 的包含重复/语义相似性标签的数据集。数据集由超过40万行行的潜在问题的问答组成。每行行数据包含问题ID、问题全文以及指示该行行是否真正包含重复对的二进制值。 | |[MS MARCO](http://www.msmarco.org/)| |MS MARCO是一种新的大规模阅读理理解和问答数据集。 在MSMARCO中,所有问题都是从真正的匿匿名用户查询中抽取的。使用先进的Bing搜索引擎版本,从实际的Web文档中提取数据集中的答案的上下文段落。 |图像类|[Open Images Dataset V4](https://storage.googleapis.com/openimages/web/index.html)|9百万|其中包括大约9百万标注图片、横跨6000个类别标签,平均每个图像拥有8个标签。该数据集的标签涵盖比拥有1000个类别标签的ImageNet具体更更多的现实实体,可用于计算机视觉方向的训练。 | |[MNIST(Image processing data set)](http://yann.lecun.com/exdb/mnist/)|约50MB,10大类,70000张图像|这是一个手写数字数据集,包含一个有着 60000 样本的训练集和一个有着 10000 样本的测试集。对于在现实世界数据上尝试学习技术和深度识别模式而言,这是一个非常好的数据库,且无需花费过多时间和精力力进行行数据预处理。 |音频类|[FMA](https://arxiv.org/abs/1612.01840)|689种|该数据集是免费音乐存档(FMA)的转储,这是一个高质量量的合法音频下载的互动库。这些数据集中包含歌曲名称、音乐类型、曲目计数等信息,共计689种歌曲和68种类型。该数据集可用于音乐分析。 | |[TED-LUM](http://www.openslr.org/7/)|21GB|TED Talk的音频数据集,包含1495个录音和音频会议、159848条发音词典和部分WMT12公开的语料料库。 |视频类|[YouTube-8M](https://research.google.com/youtube8m/)|35万小时|YouTube-8M一个大型的多样性标注的视频数据集,目前拥有610万的YouTube视频链接、35万小时视频时长、2.6亿视频/音频特征、3862个分类、平均每个视频拥有3个标签。(统计时间:2018.11.9) | |[COCO](http://cocodataset.org/)| |COCO(Common Objects in Context)是一个新的图像识别、分割和图像语义数据集,由微软赞助,图像中不不仅有标注类别、位置信息,还有对图像的语义文本描述。COCO数据集的开源使得近两、三年年来图像分割语义理理解取得了了巨大的进展,也几乎成为了了图像语义理理解算法性能评价的“标准”数据集。 |Logo类|[WebLogo-2M Dataset](http://www.eecs.qmul.ac.uk/~hs308/WebLogo-2M.html/)|178.1GB|194类,2190757张 | |[TopLogo-10 Dataset](http://www.eecs.qmul.ac.uk/~hs308/qmul_toplogo10.html/)|78.5MB|10类 |综合类|[UCI](http://archive.ics.uci.edu/ml/index.php)|400|UCI数据集中包括了了众多用于监督式和非监督式学习的数据集,数量大概400多个,其中很多数据集在其他众多数据工具中被反复引用,例如Iris、Wine、dult、Car、Evaluation、Forest Fires等。 | |[SNAP](http://snap.stanford.edu/data/index.html)| |斯坦福网络分析平台(SNAP)是一种用于分析和操纵大型网络的通用高性能系统,其本身使用的网络相关数据也对外开放,包括设计、社区、通信、网络图、互联网、道路路、维基百度网络、在线社区和评论等不不同主题,可用于分析大型社会和信息网络方面的研究成果。 - ml机器学习数据集 - dl深度学习数据集 - 大学开放数据集