Files
authority-data/data.md
2022-05-05 19:55:24 +08:00

127 lines
11 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 官方权威统计数据更新日期2022-5-5
## 中国统计年鉴 :+1::+1::+1:
http://www.stats.gov.cn/tjsj/ndsj/
- [数据下载](./data/data-tjnq.md)
***
## 全国年度统计公报 :+1::+1::+1:
http://www.stats.gov.cn/tjsj/tjgb/ndtjgb/
- [数据下载](./data/data-tjgb.md)
***
## 中国互联网络发展状况统计报告 :+1::+1::+1:
http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/index.htm
- [数据下载](./data/data-internet.md)
***
## 工信数据(工业和信息化部)统计分析数据 :+1::+1::+1:
https://www.miit.gov.cn/gxsj/index.html
- [数据下载](./data/data-miit.md)
- [原材料工业 —— 钢铁 有色 石化化工 建材 稀土 ](https://www.miit.gov.cn/gxsj/tjfx/yclgy/index.html)
- [装备工业 —— 机械 汽车 民用船舶 民用航空工业 ](https://www.miit.gov.cn/gxsj/tjfx/zbgy/index.html)
- [消费品工业 —— 轻工 纺织 食品 家电](https://www.miit.gov.cn/gxsj/tjfx/xfpgy/index.html)
- [通信业 —— 基础电信业统计数据及运行分析 ](https://www.miit.gov.cn/gxsj/tjfx/txy/index.html)
- [电子信息制造业 —— 电子信息制造业统计数据及运行分析](https://www.miit.gov.cn/gxsj/tjfx/dzxx/index.html)
- [软件业 —— 软件和信息技术服务业统计数据和运行分析 ](https://www.miit.gov.cn/gxsj/tjfx/rjy/index.html)
- [互联网 —— 互联网和相关服务业统计数据和运行分析](https://www.miit.gov.cn/gxsj/tjfx/hlw/index.html)
- [网络安全 —— 网络安全信息与动态](https://www.miit.gov.cn/gxsj/tjfx/wlaq/index.html)
***
## 中国政府网 :+1::+1::+1:
http://www.gov.cn/shuju/index.htm
- [数据下载](./data/data-gov.md)
***
## 6. 中国信通院 :+1::+1::+1:
http://www.caict.ac.cn/kxyj/
- [白皮书 271个 ](http://www.caict.ac.cn/kxyj/qwfb/bps/) [(下载)](./data/data-caict-bps.md)
- [权威数据 479个 ](http://www.caict.ac.cn/kxyj/qwfb/qwsj/) [(下载)](./data/data-caict-qwsj.md)
- [专题报告 196个 ](http://www.caict.ac.cn/kxyj/qwfb/ztbg/) [(下载)](./data/data-caict-ztbg.md)
***
## 7. 财富FORTUNE 500强 :+1::+1::+1:
[500强数据本地镜像](./top/t500.md)
- [全球排行榜](https://www.fortunechina.com/rankings/node_11663.htm)
- [世界500强](https://www.fortunechina.com/fortune500/index.htm)
😄 [2021年《财富》世界500强排行榜](https://www.fortunechina.com/fortune500/c/2021-08/02/content_394571.htm)
- [中国500强](https://www.fortunechina.com/fortune500/node_4302.htm)
😄 [2021年《财富》中国500强排行榜](https://www.fortunechina.com/fortune500/c/2021-07/20/content_392708.htm)
#### 最新榜单世界500强
- [2021年《财富》世界500强排行榜](https://www.fortunechina.com/fortune500/c/2021-08/02/content_394571.htm)
- [2021年《财富》世界500强榜单上的143家中国公司]( https://www.fortunechina.com/fortune500/c/2021-08/02/content_394569.htm)
- [2021年《财富》世界500强最赚钱的50家公司](
https://www.fortunechina.com/fortune500/c/2021-08/02/content_394570.htm)
- [2021年《财富》世界500强亏损公司](
https://www.fortunechina.com/fortune500/c/2021-08/02/content_394565.htm)
#### 最新榜单中国500强
- [2021年《财富》中国500强排行榜](https://www.fortunechina.com/fortune500/c/2021-07/20/content_392708.htm)
- [2021年《财富》中国500强亏损公司](https://www.fortunechina.com/fortune500/c/2021-07/20/content_392707.htm)
- [2021年《财富》中国500强净资产收益率ROE最高的40家公司](https://www.fortunechina.com/fortune500/c/2021-07/20/content_392706.htm)
- [2021年《财富》中国500强净利润率最高的40家公司](https://www.fortunechina.com/fortune500/c/2021-07/20/content_392705.htm)
***
## 8. 上海数据 :+1::+1::+1:
- [上海统计公报](http://tjj.sh.gov.cn/tjgb/index.html)
😄 最新-2022-03-15 [2021年上海市国民经济和社会发展统计公报 ](http://tjj.sh.gov.cn/tjgb/20220314/e0dcefec098c47a8b345c996081b5c94.html)
- [上海统计年签](http://tjj.sh.gov.cn/tjnj/index.html)
😄 [2021年上海统计年签公报 ](http://tjj.sh.gov.cn/tjnj/20220309/0e01088a76754b448de6d608c42dad0f.html)
- [数据下载](./data/data-sh.md)
**>>疫情相关<<**
- [上海市卫生健康委员会](https://wsjkw.sh.gov.cn/xwfb/index.html)
|新闻发布 |日期|
|:----|:----|
|[4月24日0-24时本市各区确诊病例、无症状感染者居住地信息](https://mp.weixin.qq.com/s/9-DRQF8pbz_2uivgscOmbw)|2022-04-25
|[上海2022年4月24日新增本土新冠肺炎确诊病例2472例 新增本土无症状感染者16983例](https://wsjkw.sh.gov.cn/xwfb/20220425/e1635e9e319b4c08a9249d3ae930aaa0.html)|2022-04-25
- [上海市商务委员会](https://sww.sh.gov.cn/swdt/index.html)
😄[(绿卡通行证企业大全——本地镜像)](./data/data-sh-yq.md)
|商务动态 |发布日期|
|:----|:----|
|[本市疫情防控生活物资保障企业查询库上线啦](https://sww.sh.gov.cn/swdt/20220419/e4df759e135642ccb870382f873cb986.html)|2022-04-18
|[全市部分已恢复线下开门营业的品牌餐饮、便利店、商超卖场网点目录4月19日更新](https://sww.sh.gov.cn/swdt/20220421/3d9f4ba3fa064cdc856c789002332e4b.html)|2022-04-20
|[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(七) 84家](https://sww.sh.gov.cn/swdt/20220421/07589027c7724736a24dbd1d2080f393.html)|2022-04-20
|[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(六)欠缺 ]|2022-04-1?
|[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(五) 75~88](https://sww.sh.gov.cn/swdt/20220418/597c7815918146a4aeab8563384e50d5.html)|2022-04-17
|[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(四) 62~74](https://sww.sh.gov.cn/swdt/20220415/7f4505aab76d4404ab067302638139cf.html)|2022-04-14
|[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(三)欠缺 ]|2022-04-1?
|[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(二) 21~42](https://sww.sh.gov.cn/swdt/20220412/42ea72bcb8854138953aa3d1d2524344.html)|2022-04-11
|[上海市商业联合会抗疫保供产销对接信息平台生活物资供应名录(一) 欠缺 ]|2022-04-?
***
## 9. 数据报告 :+1::+1::+1:
- [艾瑞咨询——产业研究报告](https://www.iresearch.com.cn/report.shtml)
😄[最新报告](./data/data-report.md)
😄[行业分类报告-24个分类](./data/data-report-type.md)
😄[行业年度报告-2012年——2022年](./data/data-report-year.md)
***
## 10. AI公开数据集^_^最好的在最后^_^ :+1::+1::+1::+1::+1: 五星强推!!!!!
- [最全中文NLP资源库](https://github.com/fighting41love/funNLP)
😄[本地镜像](./ai/funnlp.md)
- 开放数据集(Open Dataset)
|类别|名称|数量|说明|
|:----|:----|:----|:----|
|自然语言|[Question Pairs](https://data.quora.com/First-Quora-Dataset-Release-Question-Pairs)|58.7MB|第一个来源于 Quora 的包含重复/语义相似性标签的数据集。数据集由超过40万行行的潜在问题的问答组成。每行行数据包含问题ID、问题全文以及指示该行行是否真正包含重复对的二进制值。
| |[MS MARCO](http://www.msmarco.org/)| |MS MARCO是一种新的大规模阅读理理解和问答数据集。 在MSMARCO中所有问题都是从真正的匿匿名用户查询中抽取的。使用先进的Bing搜索引擎版本从实际的Web文档中提取数据集中的答案的上下文段落。
|图像类|[Open Images Dataset V4](https://storage.googleapis.com/openimages/web/index.html)|9百万|其中包括大约9百万标注图片、横跨6000个类别标签平均每个图像拥有8个标签。该数据集的标签涵盖比拥有1000个类别标签的ImageNet具体更更多的现实实体可用于计算机视觉方向的训练。
| |[MNISTImage processing data set](http://yann.lecun.com/exdb/mnist/)|约50MB,10大类70000张图像|这是一个手写数字数据集,包含一个有着 60000 样本的训练集和一个有着 10000 样本的测试集。对于在现实世界数据上尝试学习技术和深度识别模式而言,这是一个非常好的数据库,且无需花费过多时间和精力力进行行数据预处理。
|音频类|[FMA](https://arxiv.org/abs/1612.01840)|689种|该数据集是免费音乐存档FMA的转储这是一个高质量量的合法音频下载的互动库。这些数据集中包含歌曲名称、音乐类型、曲目计数等信息共计689种歌曲和68种类型。该数据集可用于音乐分析。
| |[TED-LUM](http://www.openslr.org/7/)|21GB|TED Talk的音频数据集包含1495个录音和音频会议、159848条发音词典和部分WMT12公开的语料料库。
|视频类|[YouTube-8M](https://research.google.com/youtube8m/)|35万小时|YouTube-8M一个大型的多样性标注的视频数据集目前拥有610万的YouTube视频链接、35万小时视频时长、2.6亿视频/音频特征、3862个分类、平均每个视频拥有3个标签。统计时间2018.11.9
| |[COCO](http://cocodataset.org/)| |COCOCommon Objects in Context是一个新的图像识别、分割和图像语义数据集由微软赞助图像中不不仅有标注类别、位置信息还有对图像的语义文本描述。COCO数据集的开源使得近两、三年年来图像分割语义理理解取得了了巨大的进展也几乎成为了了图像语义理理解算法性能评价的“标准”数据集。
|Logo类|[WebLogo-2M Dataset](http://www.eecs.qmul.ac.uk/~hs308/WebLogo-2M.html/)|178.1GB|194类2190757张
| |[TopLogo-10 Dataset](http://www.eecs.qmul.ac.uk/~hs308/qmul_toplogo10.html/)|78.5MB|10类
|综合类|[UCI](http://archive.ics.uci.edu/ml/index.php)|400|UCI数据集中包括了了众多用于监督式和非监督式学习的数据集数量大概400多个其中很多数据集在其他众多数据工具中被反复引用例如Iris、Wine、dult、Car、Evaluation、Forest Fires等。
| |[SNAP](http://snap.stanford.edu/data/index.html)| |斯坦福网络分析平台SNAP是一种用于分析和操纵大型网络的通用高性能系统其本身使用的网络相关数据也对外开放包括设计、社区、通信、网络图、互联网、道路路、维基百度网络、在线社区和评论等不不同主题可用于分析大型社会和信息网络方面的研究成果。
- ml机器学习数据集
- dl深度学习数据集
- 大学开放数据集