大数据技术发展史:大数据的前世今生 今天我们常说的大数据技术,其实起源于Google在2004年前后发表的三篇论文,也就是我们经常听到的“三驾马车”,分别是分布式文件系统GFS、大数据分布式计算框架M...

Python数据分析,numpy、pandas及其思维导图
在工作的过程中,发现numpy和pandas确实功能很强大,但是自己掌握的不是很熟练,搞得效率很低,所以需要疯狂的练习Python的科学计算库。
Numpy核心要点有哪些?3张思维导图帮你梳理
Numpy是python语言中使用最频繁的基础库之一,主要是进行各种数据计算处理。 我们用思维导图的形式给大家梳理了numpy的核心要点,主要是基本操作、索引与切片、常用函数方法这3个方面。 nump...
爬虫利器:Python获取免费IP代理
由于现在很多网站都有反爬虫机制,同一个ip不能频繁访问同一个网站,这就使得我们在进行大量数据爬取时需要使用代理进行伪装,本博客给出几个免费ip代理获取网站爬取ip代理的代码,可以嵌入到不同的爬虫程序中...