简书不如知乎?
代码就在文末给大家奉上。 由于简书官方对数据有所保护和限制,仅能获取单个用户的900名关注者(粉丝亦然),以及前1900篇左右的文章。在通过2-3层数据爬取后,共获得261277条用户信息,具体数据有:用户名、主页url、是否为签约作者、粉丝数、获赞数、关注数、文章数、总字数等等。
同时,但根据这1916篇文章获赞数降序可知,排名第一的文章,获赞数为:17076;排名最后的为488。由此可见,简书上最热门的文章可能都已经获取到了(其实并没有)。 BI分析 一般来说,用Python取好数之后,就是数据可视化了。 说到数据可视化,可谓是百花齐放,一时之间前端界出现了琳琅满目的第三方库: Highcharts , Echarts , Chart.js , D3.js 等。但是,万变不离其宗:需要不错的代码知识,而且这些产品其实并不是真正的开源。 那对于我们这种不会代码的小白有什么方法呢? 这就是我今天要说的BI了,也叫商业智能。百度搜索BI,就感觉内容铺天满地而来,让人摸不着头脑。其实BI真正做的好的少之又少,但国内和国外还是有一些优秀产品的。 国外代表是Tableau,157亿美金被收购,足以说明它的强大,但是对于国内来说,它不适用:
(编辑:淮安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |