学习Python:做数据科学还是网站开发?

news/2024/5/20 12:28:42/文章来源:https://blog.csdn.net/weixin_33795833/article/details/90396945

Python

Python编程语言拥有诸多用于网络应用开发、图形用户界面、数据分析、数据可视化等工作的框架和特性。Python可能不是网络应用开发的理想选择,但是正被很多机构广泛用于评估大型数据集(dataset)、数据可视化、进行数据分析或制作原型。在数据科学领域,Python编程语言正不断获得用户的亲睐,而作为网络开发语言,Python显得有点过时了。本篇博文,就是要对这两种截然不同的Python使用方式,进行详细的对比,并且帮助大家明白一点:如果要利用Python做数据科学工作,并没有必要了解它用于网络开发的部分。

面向数据科学的Python

从顶级金融机构到最小的大数据创业公司,各行各业、各种规模的机构都在使用Python编程语言支撑业务运作。Python作为数据科学编程语言,不仅受顶级大数据公司欢迎,还有众多技术创业企业拥泵。它还位列2015推荐学习的前10种编程语言。

世上只有两种编程语言:一种是总是被人骂的,一种是从来没人用的。 — Bjarne Stroustrup

Python属于前一种,而且日益被用于数学计算、机器学习和多种数据科学应用。除了性能依赖性强和底层的业务外,它能够做其他任何事情。利用Python编程语言的最好选择,就是做数据分析和统计计算。学习面向网络开发的Python,需要程序员掌握像Django这样的多种网络框架协助建设网站;但是学习面向数据科学的Python,则要求数据科学家学习如何使用正则表达式和科学计算库,并掌握数据可视化的概念。由于目的、方向不同,那些不了解Python网络开发的程序员,能很轻松地走上利用Python编程语言做数据科学工作的道路。

Python是一个有着23年历史的强大动态编程语言,语言表现力很强。程序员编码完成后,不需要编译器即可运行程序。面向网络开发的Python支持多种编程范式,包括结构化编程(structured programming)、函数式编程(functional programming)和面向对象编程(object-oriented programming, OOP)。Python代码可以很容易地嵌入到许多拥有编程接口的网络应用中。但是,Python更是开发学术研究和科学计算程序的绝佳选择,这些程序要求运行快速、数学计算精确。

而面向网络编程的Python,则要求程序员学习多种网络开发框架,这个学习难度比较大,因为现有Python网络开发框架的文档不太容易理解。当然,不容否认的是,要想利用Python开发一个动态网站或网络应用,学习网络框架是必需的。

Python网络开发框架

目前,Python社区已经有多种免费的网络应用开发框架,比如:

Django

Django是帮助完美主义者按时完成工作的Python网络开发框架(译者注:原文是Django is the python web development framework for perfectionists with deadlines。这也是Django官网上对该框架的描述)。使用Django进行网络开发,最适合的场景是开发那些依靠数据库驱动,同时也具备类似自动化后台管理界面和模板系统等炫酷功能的应用。对于不需要太多功能的网络开发项目来说,Django可能是大材小用,主要是它的文件系统容易让人搞混,而且文件目录结构要求严格。使用Django进行Python网络开发的公司有纽约时报、Instagram和Pinterest(译者注:Pinterest联合创始人Paul Sciarra在Quora上的回答提到了使用Django,Quora地址)。

Flask

Flask是针对初学者的框架,它简单,轻量,初学者很快就可以上手开发单页网络应用。这个框架并不支持验证,没有数据抽象层和其他许多框架所包括的组件。它不是一个全栈开发框架,也只用于小型网站的开发。(译者注:其实Pinterest也使用了Flask,只是没用在整站开发上,而是用来开发API,具体见链接。)

CherryPy

CherryPy框架强调要符合Python语言规范,做到程序员像进行面向对象编程一样开发网络应用。它还是诸如TurboGears和Web2py等流行全栈框架的基础模板引擎。

还有很多其他框架,包括Pyramid、Bottle和Pylons等,但是无论Python开发者使用哪一种框架,他/她都要花精力仔细地研究教程和文档。

为什么使用Python进行网络开发不现实?

Python作为网络开发语言,很可能是一个不太现实的选择:

  • 面向网络开发的Python需要非标准化、昂贵的主机服务,尤其是程序员使用流行的Python网络框架开发网站时。由于利用PHP进行网络编程如此的便捷,大部分的用户没有兴趣在Python上投入太多的精力。
  • 面向网络开发的Python与诸如PHP、Java或Ruby on Rails等语言不同,不是一个经常需要的技能。但是面向数据科学的Python却越来越受欢迎,而且由于它更多地被用于机器学习和其他数据科学程序,Python更是招聘数据科学家的公司所最看重的技能。
  • 面向网络开发的Python已经经历了较长的发展,但是它的学习曲线并没有像PHP这样的网络编程语言那么高。

为什么将Python用于数据科学是最好的选择?

Python编程是驱动大数据、金融、统计和数字运算的核心科技,而它的语法却像英语一样易懂。近来,由于拥有多个针对机器学习、自然语言处理、数据视觉化、数据探索、数据分析和数据挖掘的插件,丰富的Python数据科学生态体系得到了较大的发展,甚至有将数据科学社区Python化的趋势。今天,面向数据科学的Python已经具备了清洗、转换和处理大数据的所有工具。对于数据分析师岗位来说,掌握Python也是最受欢迎的技能。一名具备Python编程能力的数据科学家,可以在纽约挣到平均年薪14万美元的工资。

为什么数据科学家喜欢使用Python语言?

Python

数据科学家喜欢那些能够快速输出原型,帮助他们轻松地记录下自己的想法和模型的编程环境。他们喜欢通过分析巨量的数据集,得出结论,完成工作。而Python编程语言则是开发数据科学应用的多面手,因为它能帮助数据科学家,以最短最优的时间进行编码、调试、运行并获取结果,从而高效地完成工作。

一名技术娴熟的企业数据科学家的真正价值,在于利用多种数据视觉化手段,向公司的不同利益相关者有效地传递数据模式和预测。否则,数据科学工作就是一场零和游戏。Python以其优良特性,符合高强度科学计算的几乎所有方面要求,这使得它成为在不同的数据科学应用之间进行编程的绝佳选择,原因很简单:开发人员仅用一种语言就可以完成开发和分析工作。面向数据科学的Python将企业业务的不同部分连接在一起,提供了一个数据分享和处理的直接媒介。

  • Python遵循统一的设计哲学,注重可用性、可读性,对于数据科学的学习曲线也较低。
  • Python有很高的可扩展性,且与Matlab、Stata等语言相比,运行更加快速。
  • 另外,Python生态系统中还在涌现出更多的数据视觉化库,以及炫酷的应用编程结构,目的是使用图形更好地展现数据分析的结果。Python社区有着诸如Sci-Kit learn、NumPy、Pandas、Statsmodel和SciPy等许多优秀的数据分析库。这些库的数量还在不断增长。

Python

面向数据科学中数字处理与科学计算的Python编程

数据分析与Python编程语言十分契合。如果你决定要通过Python语言学习数据科学,那么你应该考虑的下一个问题,就是Python库中有哪些是可以完成大部分的数据分析工作?接下来,我们给大家介绍全球的企业数据科学家都在使用的Python数据分析库。

NumPy

Numpy是使用Python开发的高级(high level)工具的基础。这个库不能用于高级数据分析,但是深入理解Numpy中面向数组的计算,可以帮助数据科学家有效使用Pandas库。

SciPy

SciPy主要用于科学计算,拥有许多不同的模块,可用于特殊函数、图像处理、插值法(interpolation)、线性代数、常微分方程(ODE)求解器以及其他多种用途。这个库还可以与NumPy数组一起使用,实现许多高效的数学运算。

Pandas

Pandas是用于数据再加工最好的库,因为它使得处理遗失的数据、自动数据对齐(data alignment)变得更加简单,它还支持处理从不同的数据源收集而来的索引数据。

SciKit 这个流行的机器学习库拥有多种回归、分类和聚类算法,还支持gradient boosting、向量机、朴素贝叶斯模型和逻辑回归。这个库还被设计成能够与NumPy和SciPy进行交互。

Matplotlib

这是一个二维绘图库,有着交互性很强的特性,生成的图标可以放大、推移,并且能够用于发行刊物印刷出版。而且,还支持多平台的交互环境。

Matplotlib、NumPy和SciPy是科学计算的基础。还有许多其他的Python库,诸如用于网络挖掘的Pattern,用于自然语言处理的NLTK,用于深度学习的Theano,用于爬取网络的Scrappy,IPython,Statsmodels,Mlpy等。对于初学Python数据科学的人,他们需要很好地掌握上面提到的优秀数据分析库。


本文作者:佚名

来源:51CTO

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_788410.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

12-监听器实现统计网站当前在线人数

在 javaweb 项目中,利用监听器,实现统计网站当前在线人数 1、新建一个实现 HttpSessionListener 接口的实现类 OnlineCountListener.java package com.yuhuofei.javaweb.listener;import javax.servlet.ServletContext; import javax.servlet.http.HttpS…

PowerShell~发布你的mvc网站

通过使用ps加上msbuild可以方便的编译你的.net应用程序,并且可以把它发布到你的磁盘上,部署非常方例! 我们在c盘添加一个hello网站,解决方案名是hello.sln,它的网站是hello.csproj,现在使用这个脚本来生成这…

体验云上快速搭建WordPress网站小记

1月12日下午到北京阿里总部体验云上快速搭建WordPress网站,一次完美的体验,小记于此。 美好的一天,以一碗超赞的小面开始,饕餮之余,就是跟随张会长义无反顾的穿越京城。抵达望京阿里中心, 已然下午。初来乍…

大型网站技术架构(四)网站的高性能架构

2019独角兽企业重金招聘Python工程师标准>>> 网站性能是客观的指标,可以具体体现到响应时间、吞吐量、并发数、性能计数器等技术指标。 1、性能测试指标 1.1 响应时间 指应用执行一个操作需要的时间,指从发出请求到最后收到响应数据所需要的时…

天天生鲜页面设计——网站首页

页面说明&#xff1a; 1、index.html 网站首页&#xff0c;顶部“注册|登录”和用户信息是切换显示的&#xff0c;商品分类菜单点击直接链接滚动到本页面商品模块。 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/…

html5 不容易被百度收录,[百度不收录]百度不收录网站发布的文章的原因有哪些?...

有关“百度不收录网站更新的原创文章内容”这个问题&#xff0c;我以前也是有给大伙儿共享过&#xff0c;可是還是有许多人私聊我一样的难题。假如不以大伙儿处理疑虑&#xff0c;不但大伙儿不舒服&#xff0c;因为我不舒服。所以呢&#xff0c;这儿我也再为大伙儿解释一下&…

最新百度SEOer必看的文章

本文转自http://www.daxueit.com/article/2171-1.html 百度作为最大的中文搜索引擎&#xff0c;其在中国的市场占有率使广大SEOer不得不对其重视。最近百度又进行了大更新&#xff0c;让原本SEO工作就相对比较难的百度搜索引擎现在变得更难了&#xff0c;下面我们就来讲一下百度…

六个方面对360网站卫士与百度加速乐的比较

每一位站长都希望自己的网站能够更快&#xff0c;效率更高&#xff0c;用户体验更好&#xff0c;这也是网站运营最关键键的因素&#xff0c;于是&#xff0c;在用户的强烈需求下&#xff0c;国内大佬们也从中看到了潜在市场&#xff0c;权衡之后&#xff0c;纷纷推出免费网站加…

freenas 当网站服务器,win10系统下如何安装FreeNAS来设置文件服务器

win10系统下如何安装FreeNAS来设置文件服务器您是否正在构建文件服务器?FreeNAS可能是您的最佳选择&#xff0c;因为它的功能和价格(免费)。以下是安装操作系统的方法。FreeNAS是一个免费提供的开源强大的网络附加存储(NAS)操作系统&#xff0c;任何人都可以使用它来设置家庭和…

ubuntu php 建站教程,Ubuntu 16.04下搭建Web服务器(MySQL+PHP+Apache) 教程

1.开始说明本文Ubuntu 16.04下搭建Web服务器(MySQLPHPApache)的内容很多可能参照网上前辈的&#xff0c;但有所改进吧。这些设置可能会有所不同&#xff0c;你需要根据不同情况进行修改。安装apache22.切换管理员身份在ubuntu中需要用root身份进行操作,所以用下面的命令确保以r…

php导航条css代码生成器,怎么使用css代码制作网站导航栏?(示例)

本篇文章主要给大家介绍关于如何用css做导航栏的相关知识&#xff0c;希望对有需要的朋友有所帮助。对于任何一个网站来说&#xff0c;导航栏的存在是至关重要的&#xff0c;那么如果仅仅只是用html做出枯燥乏味的导航菜单&#xff0c;效果肯定是不佳的。这时css属性的重要性就…

固定ip有什么好处_外贸网站!!为什么需要全球CDN加速?

现在&#xff0c;越来越多的建站用户都会考虑全球CDN加速&#xff0c;网站使用CDN加速已经逐渐成为一种新的趋势。那么&#xff0c;为什么网站要使用CDN加速&#xff1f;CDN加速有什么作用呢&#xff1f;解决这个问题&#xff0c;我们需要先了解的是&#xff0c;网站访问为什么…

wordpress acf字段 不同样式_全球知名大公司都在用WordPress建站案例,您想成为其中一员吗?...

WordPress是一款个人博客系统&#xff0c;并逐步演化成一款内容管理系统&#xff0c;它使用PHP语言和MySQL数据库开发。其强大的内容管理系统已能够制作精美的网站及WordPress商城。据统计&#xff0c;所有网站中有28.6&#xff05;使用WordPress。许多知名大品牌都在用WordPre…

seo代码优化工具_如何分析竞争对手的SEO优化数据

如何分析竞争对手的SEO优化数据作为一个称职的SEO优化师要学会如何分析同行站点的&#xff0c;取别人的长处&#xff0c;补自己的短处&#xff0c;并将这个做得更好&#xff0c;那么你的网站比起同行网站也就更好&#xff0c;排名自然也能比别人的好。一&#xff1a;查看分析网…

9个免费图标下载网站

很多人都希望给自己的系统或者博客添加上漂亮的图标吧.在下面这些网站你可以找到自己喜欢的Web2.0式的图标,它们针对个人的非商业使用都是免费的,所有的图标都是根据各种各样的主题和使用目的设计. 1.Free Web Icons 这里有15000多种免费高质量图标供你下载使用. 2.Web Site Ic…

js模板引擎_5分钟上手Egg.js+nunjucks模板引擎快速开发SEO友好的官网项目

在日常的项目中&#xff0c;有时候还是不可避免的会维护一些jq官网项目等。面对此类需求&#xff0c;很多还是以前的老套路&#xff0c;前端写页面交给后端去套数据。很烦有木有&#xff5e;&#xff5e;而改动之后还得交给后端再次修改&#xff0c;时间和沟通都是个麻烦。同时…

安装网站时mysql连接错误代码_安装MySQL启动服务时报错解决办法,错误代码1045...

散打狼在安装mysql的时候&#xff0c;在下图中的Start service这个步骤出错&#xff0c;我尝试用客户端登录&#xff0c;无法登录&#xff0c;报错如下。解决办法如下MySQL 连接错误&#xff0c;使用Navicat连接MySQL出现错误&#xff1a;1045 Access denied for user rootloca…

img标签中alt属性与title属性在seo的作用-摘自网友

img标签中alt属性与title属性作用&#xff0c;也许大家比较迷惑&#xff0c;现在给大家举例说明。alt属性是图片的替换文字。title属性规定元素的额外信息&#xff0c;有视觉效果。目录 alt属性title属性ie和firefox下展示img标签中alt属性与title属性作用&#xff0c;也许大家…

大型网站--负载均衡架构

负载均衡 &#xff08;Load Balancing&#xff09; 负载均衡建立在现有网络结构之上&#xff0c;它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。 大型网站负载均衡的利器 全局负载均衡系统&#xf…

SharePoint2013配置网站邮箱1

来自&#xff1a;http://rdsrv.blog.51cto.com/2996778/1252117 站点邮箱是Sharepoint 2013的新功能&#xff0c;不知道大家是否知晓&#xff0c;可以在一个网站集下的项目网站上开启站点邮箱&#xff0c;这样根据项目的邮件都会在这里进行汇总&#xff0c;方便相关的管理和查阅…