再聊聊我常用的15个数据源网站

news/2024/5/20 11:32:03/文章来源:https://blog.csdn.net/Xw_Classmate/article/details/124938138

前面介绍过实用的效率小工具,真的帮了我很多忙,这次给小伙伴们再种草一些数据源网站。

现在有很多免费的数据可以供使用分析,不过很少有人能找的到,或者没能力找,这就是所谓的信息差吧。其实数据获取分为两方面,一是“拿来的”数据,也就是现成的;二是“爬来的”数据,这种一般通过爬虫等手段去采集数据。

“拿来的”数据可以在各大官方平台或者社区去找,一般各行各业都会有自己的数据库。我常用的数据网站有以下这些:

搜索指数类

百度指数:百度搜索汇总的数据,能看到各种关键词的搜索热度趋势,优点数据量大,能反映真实的话题热度变化,适合做需求洞察、用户画像、舆情监测、市场分析。

百度指数规则,是以网民在百度的搜索量为数据基础,以关键词为统计对象,科学分析并计算出各个关键词在百度网页搜索中搜索频次的加权和。

4dd694f371d78a6b8687fd08e1b3fb5b.png

微信指数:微信生态的大数据,反映关键词热度,和百度指数类似。但微信指数数据来源微信各种内容渠道,包括搜一搜、视频号、公众号等,适合做微信生态人群画像、内容推广、舆情监控的研究。

在计算关键词指数的过程中,微信指数主要关注:

  • 关键词相关内容的受欢迎程度。

  • 关键词在相关内容中的重要程度。

1e87cd3abef93c23150d076b00f96572.png

Google Trends:和百度指数类似的产品,基于google生态汇总的大数据。比百度数据来源更丰富也更广泛,包含了google、youtube等,毕竟是全球应用。缺点是对国内搜索分析的指导意义不大,还是百度指数更具指导意义。

5375e7360315df0bea772c83078506f6.png

微博指数:微博内容提及量、阅读量、互动量加权得出的综合指数,优点比较有时效性,而且数据基数大,可以实时反映热度变化情况,适合实时捕捉当前社会热点事件、热点话题等,快速响应舆论走向等。

6b2e7106edc76c99b02071c769066c0c.png

媒体数据

这种数据包含了网站、APP、自媒体账号等监测数据,大多是商业付费类

Alexa:用于查询全球网站排名和流量的平台,可以看到PV、UV、排名、区域分布等信息。

1dbf75570ae9abde6e5e78cd5a1ba191.png

新榜:新媒体专属的数据平台,用于查看抖音、快手、公众号、小红书等平台KOL账号的数据。数据包括了粉丝、浏览、互动、声量等,一般用于广告投放监测、自媒体数据运营等。

37975aa10a41a5176dfdcf9987e11b08.png

猫眼数据:影视相关数据。汇总了电影票房、网播热度、电视收视等数据,适合做票房预测、节目热度监测。

b7b2c988c5d45facf9a1170c1c75da81.png

艾瑞指数:APP、Web、手机等排行榜数据,包括各大移动设备装机指数、APP热度指数、PC Web热度指数、网络广告指数等等,适合做广告营销投放等。

aa2b2ad4871691917349de2e68bf1776.png

金融数据

新浪财经数据中心:新浪财经大数据,汇总了股票、基金、期货、黄金、货币等各种财经数据,种类很齐全,应该有数据接口。

e34f1e234d2ce27fc3cb746365bc884f.png

Wind:国内比较早的金融数据服务商,数据种类最齐全,而且有各种金融分析工具,也支持Python、R等量化分析。但Wind很贵,个人很难承担的起。

07b7681fc6e70e3db3b5e982c3697a27.png

Tushare:免费的金融数据库,支持Python接口,数据也非常齐全,包含了股票、基金、期权、债券、外汇、公司报表等各种财经数据。只要你会用Python,就可以调用里面的各种数据,非常便捷。

c56dbc8c9a73db5475952358aaa565f8.png

社会数据

这种一般包含政府开放数据、统计数据,以及各种民生数据。

国家统计局:最权威的国内宏观数据网站,包括人口、经济、农业等等。

4babb6a3f567c7d96829a3ec5e3a004f.png

上海公共数据开放平台:上海市各行各业的免费数据,对公众开放下载,非常适合做城市规划分析。

541491fe2c990a73a70415cb04f1f7e7.png

其他城市官方数据:

221869d6c9684a8538dfc7d9fc90e9dd.png02028e518f20229e8281beae3ece724c.png

数据科学研究数据

这一类数据适合做机器学习、统计分析、算法研究等,是学术界、工业界用于数据驱动业务典型数据。

kaggle:全球最大的数据科学比赛平台,也是google旗下的产品。kaggle拥有丰富的数据集和各种解决方案,适合对数据感兴趣的小伙伴去研究学习。

21c0649ae4de9d1c17bfbe5789774614.png

天池:阿里云里面的数据比赛平台,也拥有很多比赛数据,质量相对较高。

333ee62d249f4f0361ec453eec039675.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_747406.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

优化网站设计(十七):延迟或按需加载内容

前言 网站设计的优化是一个很大的话题,有一些通用的原则,也有针对不同开发平台的一些建议。这方面的研究一直没有停止过,我在不同的场合也分享过这样的话题。 作为通用的原则,雅虎的工程师团队曾经给出过35个最佳实践。这个列表请参考 Best Practices f…

企业建站程序哪个好?

企业建站程序推荐使用的Eyoucms企业网站管理系统,同其它同行的企业建站系统来说,Eyoucms企业网站管理系统有些什么优势呢?1、网络的安全性是网民一直担心的问题,可能随时不小心就被黑掉或者被恶意挂上使得网站无法正常运营&#x…

ASP.NET本质论第一章网站应用程序学习笔记1

1.统一资源标示符 1) 格式:协议://主机[.端口号][绝对路径[?参数]],在Http://www.kencery.com/hyl/index/login中,http表示协议的名称,www.kencery.com表示主机的地址,可选的端口号没有出现,那么&#xff…

一个学习数据科学的可视化网站

https://setosa.io/ev/markov-chains/ 可以通过调节样本的参数,理解模型在干些什么

如何查找网站漏洞文件任意查看漏洞详情与利用

2019独角兽企业重金招聘Python工程师标准>>> 在对网站程序代码的安全检测当中,网站文件任意查看漏洞在整个网站安全报告中属于比较高危的网站漏洞,一般网站里都会含有这种漏洞,尤其平台,商城,交互类的网站较…

单位网站老是被劫持跳转到博彩网站怎么办

这几天我们Sine安全接到一个单位服务器里的三个网站都被劫持跳转问题的客户反映在百度搜索关键词后点击进入网站直接被跳转到菠菜网站,直接在浏览器里输入网址是正常打开的,由于客户单位网站的领导比较重视这个被恶意劫持跳转的问题特别要求加班要抓紧处理解决掉这个网站安全问…

phantomjs 抓取、截图中文网站乱码的问题的解决

2019独角兽企业重金招聘Python工程师标准>>> 1、用phantomjs抓取html乱码的解决方案: phantomjs --output-encodinggbk test.js http://webscan.360.cn/index/checkwebsite?urlwww.coding123.net 这两个参数可以指定编码 ... --output-encodingencoding…

《大型网站服务器容量规划》——3.4 通过回归方程规划容量

本节书摘来自异步社区《大型网站服务器容量规划》一书中的第3章,第3.4节,作者: 郑钢 更多章节内容可以访问云栖社区“异步社区”公众号查看。 3.4 通过回归方程规划容量 回归方程是统计学里面的知识,是一种应用数学,通常属于数学…

Chrome 不想让 HTTPS 网站通过 HTTP 下载文件

你是否经历过访问的明明是一个 HTTPS 网站,但是有时候站内下载东西使用的协议却是 HTTP,这其实存在安全隐患,现在 Chrome 不想让这样的事情发生。 ZDNet 报导,谷歌 Chrome 工程师正计划在 HTTPS 网站上默认禁止一些通过 HTTP 下载…

windows 2003和server 2008 取消对网站的安全检查/去除添加信任网站

2019独角兽企业重金招聘Python工程师标准>>> 服务器管理器->安全信息->配置IE ESC->管理员禁用->确定并重启浏览器 正常访问网站,提示如下: 转载于:https://my.oschina.net/guiguketang/blog/3037114

PHP开发网站到瓶颈了,技术上不知如何突破

2019独角兽企业重金招聘Python工程师标准>>> 推荐的一些牛逼的博客网站: 风雪之隅 看几个大公司的技术博客,学习一下一线的开发人员都在做什么,就差不多了腾讯大讲堂腾讯全端 AlloyTeam 团队点评美团技术团队蘑菇街技术博客 Nginx…

SEO终极算法(二)

上一篇我的文章《草根站长这一年用血的教训换来的SEO终极算法》受到了许多读者的争议。今天为了迎合读者迫切的需求,特意写了SEO终极算法(二),希望给做SEO的朋友们能有一些启发。本篇文章比较基础常识性的SEO基础的问题我就不写了,只写比较有…

TP5实现支付宝电脑网站支付学习笔记

这两天在公司做一个小型WEB项目,需要有支付功能。第一次做支付宝的支付,踩了点小坑,还算顺利。激动的我赶紧记下实现的流程。第一步当然是在支付宝开放平台申请公钥私钥APPID等,支付宝关官方文档都有详细介绍,这里就省略。申请完了…

云服务器 ECS 建站教程:快速搭建 phpwind 论坛系统

快速搭建 phpwind 论坛系统phpwind 是采用 PHP MySQL 方式运行的开源社区程序。轻架构,高效率简易开发,帮助您快速搭建并轻松管理社区站点。phpwind 提供了 2 款完全不同的版本,分别是拥有成熟功能、海量插件支撑的 phpwind 稳定版&#xff…

记一次JavaWeb网站技术架构总结

俗话说的好,冰冻三尺非一日之寒,滴水穿石非一日之功,罗马也不是一天就建成的,当然对于我们开发人员来说,一个好的架构也不是一蹴而就的。 初始搭建 开始的开始,就是各种框架一搭,然后扔到Tomcat…

网站SSL安装配置

背景介绍:HTTPS,全称:Hyper Text Transfer Protocol over Secure Socket Layer,是通过SSL安全机制传输,保证网站数据不被窃听、冒充、篡改等安全风险,保证网站传输安全可靠,下面是通过nginx配置ssl模块记录…

【提权过程】嘉缘网站--提权,代理,内网渗透(针对445端口)

这篇是由上篇 【渗透过程】嘉缘网站--测试https://www.cnblogs.com/G-Shadow/articles/10964374.html之后的操作,文章包括了提权,HTTP代理及对内网的渗透 使用蚁剑连接上写入的一句话后,使用虚拟终端发现自己权限为最高权限可以执行任何操作 …

大型网站技术架构(五)网站高可用架构

2019独角兽企业重金招聘Python工程师标准>>> 网站的可用性(Avaliability)描述网站可有效访问的特性。 1、网站可用性的度量与考核 网站不可用时间(故障时间)故障修复时间点-故障发现(报告)时间点…

大型网站技术架构(四)网站的高性能架构

2019独角兽企业重金招聘Python工程师标准>>> 网站性能是客观的指标,可以具体体现到响应时间、吞吐量、并发数、性能计数器等技术指标。 1、性能测试指标 1.1 响应时间 指应用执行一个操作需要的时间,指从发出请求到最后收到响应数据所需要的时…