学习Python:做数据科学还是网站开发?

news/2024/4/28 11:34:25/文章来源:https://blog.csdn.net/weixin_34321753/article/details/89502336

译者注:本文的英文原文地址是:Python for Data Science vs Python for Web Development,发布时间是10月29日。译者一开始在Python日报上看到推荐,初步看看了,觉得对于决定学习Python的方向有一定参考价值。不过,在翻译过程中,越来越觉得这其实就是一篇搞Python数据科学培训的公司写的软文,里面写的内容还是比较浅的,只适合像我这样的初学者了解大致情况。当然,文章提到了Python作为网络开发技能的市场需求并不是很高,这点感觉并不是没有根据。作为一篇软文,它成功地激起了我学习数据科学的兴趣,而原因嘛,自然就是做数据科学工作的工资比一般开发工作,高很多(按文章中信息图的数据,比一般岗位的年薪高5万美刀!!!)!

Python编程语言拥有诸多用于网络应用开发、图形用户界面、数据分析、数据可视化等工作的框架和特性。Python可能不是网络应用开发的理想选择,但是正被很多机构广泛用于评估大型数据集(dataset)、数据可视化、进行数据分析或制作原型。在数据科学领域,Python编程语言正不断获得用户的亲睐,而作为网络开发语言,Python显得有点过时了。本篇博文,就是要对这两种截然不同的Python使用方式,进行详细的对比,并且帮助大家明白一点:如果要利用Python做数据科学工作,并没有必要了解它用于网络开发的部分。

python:web development vs data science

面向数据科学的Python

从顶级金融机构到最小的大数据创业公司,各行各业、各种规模的机构都在使用Python编程语言支撑业务运作。Python作为数据科学编程语言,不仅受顶级大数据公司欢迎,还有众多技术创业企业拥泵。它还位列2015推荐学习的前10种编程语言。

世上只有两种编程语言:一种是总是被人骂的,一种是从来没人用的。
-- <cite>Bjarne Stroustrup</cite>

Python属于前一种,而且日益被用于数学计算、机器学习和多种数据科学应用。除了性能依赖性强和底层的业务外,它能够做其他任何事情。利用Python编程语言的最好选择,就是做数据分析和统计计算。学习面向网络开发的Python,需要程序员掌握像Django这样的多种网络框架协助建设网站;但是学习面向数据科学的Python,则要求数据科学家学习如何使用正则表达式和科学计算库,并掌握数据可视化的概念。由于目的、方向不同,那些不了解Python网络开发的程序员,能很轻松地走上利用Python编程语言做数据科学工作的道路。

Python是一个有着23年历史的强大动态编程语言,语言表现力很强。程序员编码完成后,不需要编译器即可运行程序。面向网络开发的Python支持多种编程范式,包括结构化编程(structured programming)、函数式编程(functional programming)和面向对象编程(object-oriented programming, OOP)。Python代码可以很容易地嵌入到许多拥有编程接口的网络应用中。但是,Python更是开发学术研究和科学计算程序的绝佳选择,这些程序要求运行快速、数学计算精确。

而面向网络编程的Python,则要求程序员学习多种网络开发框架,这个学习难度比较大,因为现有Python网络开发框架的文档不太容易理解。当然,不容否认的是,要想利用Python开发一个动态网站或网络应用,学习网络框架是必需的。

Python网络开发框架

目前,Python社区已经有多种免费的网络应用开发框架,比如:

Django

Django是帮助完美主义者按时完成工作的Python网络开发框架(译者注:原文是Django is the python web development framework for perfectionists with deadlines。这也是Django官网上对该框架的描述)。使用Django进行网络开发,最适合的场景是开发那些依靠数据库驱动,同时也具备类似自动化后台管理界面和模板系统等炫酷功能的应用。对于不需要太多功能的网络开发项目来说,Django可能是大材小用,主要是它的文件系统容易让人搞混,而且文件目录结构要求严格。使用Django进行Python网络开发的公司有纽约时报、Instagram和Pinterest(译者注:Pinterest联合创始人Paul Sciarra在Quora上的回答提到了使用Django,Quora地址)。

Flask

Flask是针对初学者的框架,它简单,轻量,初学者很快就可以上手开发单页网络应用。这个框架并不支持验证,没有数据抽象层和其他许多框架所包括的组件。它不是一个全栈开发框架,也只用于小型网站的开发。(译者注:其实Pinterest也使用了Flask,只是没用在整站开发上,而是用来开发API,具体见链接。)

CherryPy

CherryPy框架强调要符合Python语言规范,做到程序员像进行面向对象编程一样开发网络应用。它还是诸如TurboGears和Web2py等流行全栈框架的基础模板引擎。

还有很多其他框架,包括Pyramid、Bottle和Pylons等,但是无论Python开发者使用哪一种框架,他/她都要花精力仔细地研究教程和文档。

为什么使用Python进行网络开发不现实?

Python作为网络开发语言,很可能是一个不太现实的选择:

  • 面向网络开发的Python需要非标准化、昂贵的主机服务,尤其是程序员使用流行的Python网络框架开发网站时。由于利用PHP进行网络编程如此的便捷,大部分的用户没有兴趣在Python上投入太多的精力。

  • 面向网络开发的Python与诸如PHP、Java或Ruby on Rails等语言不同,不是一个经常需要的技能。但是面向数据科学的Python却越来越受欢迎,而且由于它更多地被用于机器学习和其他数据科学程序,Python更是招聘数据科学家的公司所最看重的技能。

  • 面向网络开发的Python已经经历了较长的发展,但是它的学习曲线并没有像PHP这样的网络编程语言那么高。

为什么将Python用于数据科学是最好的选择?

Python编程是驱动大数据、金融、统计和数字运算的核心科技,而它的语法却像英语一样易懂。近来,由于拥有多个针对机器学习、自然语言处理、数据视觉化、数据探索、数据分析和数据挖掘的插件,丰富的Python数据科学生态体系得到了较大的发展,甚至有将数据科学社区Python化的趋势。今天,面向数据科学的Python已经具备了清洗、转换和处理大数据的所有工具。对于数据分析师岗位来说,掌握Python也是最受欢迎的技能。一名具备Python编程能力的数据科学家,可以在纽约挣到平均年薪14万美元的工资。

为什么数据科学家喜欢使用Python语言?

为什么数据科学家喜欢使用Python语言

数据科学家喜欢那些能够快速输出原型,帮助他们轻松地记录下自己的想法和模型的编程环境。他们喜欢通过分析巨量的数据集,得出结论,完成工作。而Python编程语言则是开发数据科学应用的多面手,因为它能帮助数据科学家,以最短最优的时间进行编码、调试、运行并获取结果,从而高效地完成工作。

一名技术娴熟的企业数据科学家的真正价值,在于利用多种数据视觉化手段,向公司的不同利益相关者有效地传递数据模式和预测。否则,数据科学工作就是一场零和游戏。Python以其优良特性,符合高强度科学计算的几乎所有方面要求,这使得它成为在不同的数据科学应用之间进行编程的绝佳选择,原因很简单:开发人员仅用一种语言就可以完成开发和分析工作。面向数据科学的Python将企业业务的不同部分连接在一起,提供了一个数据分享和处理的直接媒介。

  • Python遵循统一的设计哲学,注重可用性、可读性,对于数据科学的学习曲线也较低。

  • Python有很高的可扩展性,且与Matlab、Stata等语言相比,运行更加快速。

  • 另外,Python生态系统中还在涌现出更多的数据视觉化库,以及炫酷的应用编程结构,目的是使用图形更好地展现数据分析的结果。Python社区有着诸如Sci-Kit learn、NumPy、Pandas、Statsmodel和SciPy等许多优秀的数据分析库。这些库的数量还在不断增长。

面向数据科学的Python库

面向数据科学中数字处理与科学计算的Python编程

数据分析与Python编程语言十分契合。如果你决定要通过Python语言学习数据科学,那么你应该考虑的下一个问题,就是Python库中有哪些是可以完成大部分的数据分析工作?接下来,我们给大家介绍全球的企业数据科学家都在使用的Python数据分析库。

NumPy

Numpy是使用Python开发的高级(high level)工具的基础。这个库不能用于高级数据分析,但是深入理解Numpy中面向数组的计算,可以帮助数据科学家有效使用Pandas库。

SciPy

SciPy主要用于科学计算,拥有许多不同的模块,可用于特殊函数、图像处理、插值法(interpolation)、线性代数、常微分方程(ODE)求解器以及其他多种用途。这个库还可以与NumPy数组一起使用,实现许多高效的数学运算。

Pandas

Pandas是用于数据再加工最好的库,因为它使得处理遗失的数据、自动数据对齐(data alignment)变得更加简单,它还支持处理从不同的数据源收集而来的索引数据。

SciKit
这个流行的机器学习库拥有多种回归、分类和聚类算法,还支持gradient boosting、向量机、朴素贝叶斯模型和逻辑回归。这个库还被设计成能够与NumPy和SciPy进行交互。

Matplotlib

这是一个二维绘图库,有着交互性很强的特性,生成的图标可以放大、推移,并且能够用于发行刊物印刷出版。而且,还支持多平台的交互环境。

Matplotlib、NumPy和SciPy是科学计算的基础。还有许多其他的Python库,诸如用于网络挖掘的Pattern,用于自然语言处理的NLTK,用于深度学习的Theano,用于爬取网络的Scrappy,IPython,Statsmodels,Mlpy等。对于初学Python数据科学的人,他们需要很好地掌握上面提到的优秀数据分析库。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_738249.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

10个学习Java的网站,肯定有你不知道的哦!

不管谁手里都藏着些许自己觉得好用的网站&#xff0c;今天专门找大厂出来的同学同事觉得好用的网站分享给大家&#xff0c;如果这里有你没收藏还不知道觉得还蛮有用的网站可以给我点个赞&#xff0c;大家一起进步&#xff0c;一起学习&#xff0c;同时也可以分享你觉得好用实用…

分享几个超多好看|高清|免费|壁纸的网站

1. Космос | joer.ru 一个关于宇宙、星空、航空航天器的壁纸网站&#xff0c;没有固定的网址&#xff0c;点击连接后每次刷新都会呈现不同的壁纸&#xff1b;点击喜欢的壁纸跳转到新的页面还可以选择需要的分辨率&#xff0c;网站十分简洁&#xff0c;只能看到图片。 2. …

当你的网站被疯狂攻击时你能做什么?

前言自开始搭建网站八爪鱼招标网到现在大概有四个多月的时间&#xff0c;搜索引擎收录方面也从零收录逐渐的发展到在百度有四十万的收录&#xff0c;在360搜索有四万多的收录&#xff0c;搜索引擎流入的流量也慢慢增多&#xff0c;今天上班时 发现网站出现有故障&#xff0c;主…

一些关于SEO优化的笔记

高级搜索指令&#xff1a; 双引号&#xff1a;“xxx” 代表完全匹配的搜索 减号&#xff1a;-&#xff08;减号前面必须是空格&#xff0c;后面必须没有空格&#xff09;代表搜索不包含减号后面的词的页面 filetype&#xff1a;用于搜索特定文件格式&#xff08;百度支持的文件…

《音乐达人秀:Adobe Audition CC实战222例》——1.5 网络与网站已成为人们获取音乐的最佳途径...

本节书摘来自异步社区《音乐达人秀&#xff1a;Adobe Audition CC实战222例》一书中的第1章&#xff0c;第1.5节&#xff0c;作者 健逗&#xff0c;更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.5 网络与网站已成为人们获取音乐的最佳途径 多年前&#xff0c;没有…

云服务器 ECS 搭建WordPress网站:部署 Web 环境(LAMP)

部署 Web 环境&#xff08;LAMP&#xff09;本节介绍如何使用 云市场 的 阿里云linux一键安装web环境 一键部署 Web 环境&#xff0c;包括安装 Nginx、MySQL、PHPWind 和 phpMyAdmin。 软件包中包含的软件及版本如下&#xff1a; Nginx&#xff1a;1.4.4Apache&#xff1a;2.2.…

《社交网站界面设计(原书第2版)》——3.12 密码的反模式

3.12 密码的反模式 什么是密码的反模式呢&#xff1f;这为什么值得一提呢&#xff1f;许多社交网站一直都在与“零状态启动”状态做斗争&#xff1a;用户刚刚进入网站后没有好友&#xff0c;网站可能会将用户数据与从其他的网络服务&#xff08;例如&#xff0c;用户的在线通讯…

提示框组件_爱了!这个网页气泡提示组件,让你的网站更炫酷!

网页设计师对 tooltips 鼠标经过提示效果应该不陌生&#xff0c;这种效果虽然可以直接用 css hover 来实现&#xff0c;但是如果想更友好的、更美观的效果&#xff0c;可能就要借助 JS 来实现。今天和大家分享的 Tippy.js 就是很不错的鼠标悬念插件&#xff0c;多种提示信息用法…

Best Practices for Speeding Up Your Web Site(网站优化)

2019独角兽企业重金招聘Python工程师标准>>> Best Practices for Speeding Up Your Web Site Minimize HTTP Requests tag: content 80% of the end-user response time is spent on the front-end. Most of this time is tied up in downloading all the component…

wordpress mysql 搭建_Centos 7 MySQL安装+搭建wordpress网站

首先应该搭建本地yum源&#xff0c;见网址(http://www.cnblogs.com/zxbdbk/p/6020679.html)。将mysql文件安装包放入 /var/opt 文件夹下[rootlocalhost ~]# yum install /var/opt/*.* -y[rootlocalhost ~]# systemctl restart mysqld.service[rootlocalhost ~]# yum install -y…

Android使用OpenGL编程,小结 - Android OpenGL ES 简明开发教程_Linux编程_Linux公社-Linux系统门户网站...

前面简单介绍了OpenGL ES的开发&#xff1a;和2D图形相比&#xff0c;3D绘图要复杂的多&#xff0c;Android提供了OpenGL ES 3D 图形开发包&#xff0c;对应熟悉OpenGL开发的不会很难&#xff0c;但如果一直没有从事3D开发过&#xff0c;一时还不容易上手&#xff0c;因此暂时跳…

服务器怎么设置网站写入权限,服务器如何设置写入权限

服务器如何设置写入权限 内容精选换一换MongoDB官网提供了针对不同操作系统的客户端安装包&#xff0c;其二进制安装包下载页面链接为&#xff1a;https://www.mongodb.com/download-center#community。下面将以RedHat/CentOS 7.0和MongoDB 3.4.24为例&#xff0c;介绍如何获取…

win7 asp mysql_使用InstallShield下部署ASP.NET网站和MySQL,目标机为Win7——(一)使用bat批处理部署非安装版MySQL...

使用bat部署MySQL对于mysql的安装分为两种&#xff0c;msi的安装版&#xff0c;和zip的非安装版。我们使用后者。非安装版即&#xff0c;解压缩之后&#xff0c;运行一个命令&#xff0c;在客户机上注册mysql的windows服务即可使用mysql数据库。首先MSI是安装版&#xff0c;ZIP…

Redis简单案例(一) 网站搜索的热搜词

原文:Redis简单案例(一) 网站搜索的热搜词对于一个网站来说&#xff0c;无论是商城网站还是门户网站&#xff0c;搜索框都是有一个比较重要的地位&#xff0c;它的存在可以说是 为了让用户更快、更方便的去找到自己想要的东西。对于经常逛这个网站的用户&#xff0c;当然也会想…

复制服务器网站,深刻理解站点和复制(实现站点以管理AD中的复制)

站点是一组有效连接的子网。站点和域不同&#xff0c;站点代表网络的物理结构&#xff0c;而域代表组织的逻辑结构。使用站点的好处&#xff0d;简化管理&#xff1a;1.复制。通过在站点内更为频繁(与站点之间复制信息相比)地复制信息&#xff0c;Active Directory平衡对最新目…

吉林社科规划网站转换计划

概述<?xml:namespace prefix o ns "urn:schemas-microsoft-com:office:office" />吉林社科网站:http://www.jlpopss.gov.cn是本人开发&#xff08;后台代码&#xff0c;非界面设计&#xff09;并长时间维护的网站&#xff0c;根据以前开发的经验决定对系统进…

卸载再重装php致使网站502,调试php时网站出现502的解决方法

这是第二次遇到该问题了&#xff0c;上次解决后由于没有记录&#xff0c;结果此次遇到后又得从新查找解决方法。记忆力严重减退了啊&#xff0c;仍是要保持边学边记录的习惯php 网站在正常运行时是没有问题的&#xff0c;可是在使用xdebug进行远程调试时&#xff0c;可能会由于…

前嗅ForeSpider教程:网站登录配置

当我们在采集中碰到&#xff1a;所采集的网站数据需要登录&#xff0c;才可以看到所需信息时&#xff0c;则需要在软件中模拟登陆环境&#xff0c;采集数据&#xff0c;此时需要配置登录信息。今天小编就教大家&#xff1a;如何进行网站登录配置&#xff0c;具体步骤如下&#…

在Microsoft Office SharePoint Server 2007中使用“我的网站”

12.7 “我的网站”是用于集中管理和存储您的文档、内容、链接以及联系人的个人网站。组织中的其他用户可以通过“我的网站”查找关于您和您的技能及兴趣的信息。内容提供商可以使用“我的网站”来自定义显示给用户的信息。 12.7.1 “我的网站”概述 “我的网站”可以提供&#…

利用json隔离网站布局和页面实际模块的内容载入

在项目中,有个这样的需求:动态维护页面的布局,以及动态载入布局容器中的具体模块。最开始的实现方式是&#xff0c;在服务端一次性获取当前页面的布局结构&#xff0c;当前页面的所有功能模块&#xff0c;同时通过循环检索某一功能模块属于哪个容器并合理放置&#xff0c;最后获…