天道酬勤,学无止境

读芯术python_Python仍是人工智能和机器学习的主导编程语言吗?

上世纪90年代初,Python面世了。近30年来,关于它的“炒作”一直没有少过。当然,编程界花了至少20年的时间才认识到它,但自那以后,它的流行程度远远超过了C、C#、Java甚至Javascript。

尽管Python目前在数据科学和机器学习领域,以及某些程度上在科学和数学计算领域占据着主导地位,但与Julia,Swift和Java等新语言相比,它确实有其劣势。

是什么让Python如此受欢迎?

Python迅速发展的主要原因是易于学习和功能强大。这使得它对初学者,包括那些由于C、C++等语言语法艰涩且陌生而对其望而却步的人,都非常有吸引力。

该语言从根本上广泛强调代码的可读性。凭借其简洁而富有表现力的语法,它允许开发人员在不编写大量代码的情况下表达想法和概念(例如在C或Java等低级语言)。Python非常简单,可以与其他编程语言无缝集成(例如将CPU密集型任务卸载到C / C ++),这对多语言开发人员来说是一个加分项。

Python用途广泛的另一个原因是大型企业(包括FAANG)以及无数小型企业对其的大量使用。如今,Python包里几乎包含了可以想到的任何东西——用于科学计算的Numpy,用于机器学习的Sklearn和用于计算机视觉的Caer。

Python也有缺点

它运行很慢,非常慢

显而易见,在未来很长一段时间里,速度都是开发人员的主要关注点之一。

Python之所以“慢”,实际上有两个原因——Python被解释为与编译相反,最终导致执行速度较慢;以及它是动态类型的(Python在执行过程中自动推断变量的数据类型)。

事实上,“Python很慢”这一说法对初学者影响很大。这是真的,但只是部分事实。以Python中可用的机器学习库TensorFlow为例,这些库其实是用C++编写的,并可以在Python中使用,某种程度上构成了围绕C++实现的Python“装饰器”。Numpy,甚至Caer,在一定程度上也是如此。

它有一个GIL(I)

Python速度缓慢的主要原因之一是存在GIL(全局解释器锁),它一次只能执行一个线程。虽然这可以提高单线程的性能,但它限制了并行性,开发人员必须实现多处理程序而非多线程程序来提高速度。

不是内存密集型任务的最优解

当对象超出范围时,Python会自动进行垃圾回收。它旨在消除C和C++在内存管理方面的所涉及的许多复杂问题。由于指定数据类型的灵活性(或缺乏灵活性),Python消耗的内存量可能会迅速爆炸增长。此外,运行时可能会弹出Python未关注的错误,最终减缓开发过程。

移动计算中的弱存在

随着台式机到智能手机的巨大转变,很明显,我们需要更强大的语言来构建手机软件。尽管Python在台式机和服务器平台上具有很强的代表性,但是由于缺乏强大的移动计算处理能力,Python往往会在移动开发上失败。

近年来,这一领域有了很大进步,但是这些新添加的库与Kotlin,Swift和Java等强大的竞争对手相比仍有差距。

其他语言的兴起

最近,Julia,Rust和Swift等较新的语言强势入局。它们借鉴了Python,C/C ++和Java的许多优秀设计概念——Rust基本保证了运行时的内存安全性和并行性,并提供与WebAssembly的一流互操作性;由于支持LLVM编译器工具链,Swift几乎与C一样快;而Julia为I/O密集型任务提供了异步I/O,并且速度非常快。

Python从来就是很好的编程语言,它从来没有超越C/C++和Java。它是一种通用的编程语言,强调人类可读的、以英语为中心的语法,允许程序和应用程序的快速开发。

归根结底,Python和其他语言一样,是一种工具。有时候,它是很好的工具。有时候不是。大多数情况下,只是 “还不错”。

Python作为一种编程语言会消亡吗?笔者不这么认为。

那么,它的魅力正在消失吗?也许有一点,但只是一点点。

责编AJX

打开APP阅读更多精彩内容

点击阅读全文

受限制的 HTML

  • 允许的HTML标签:<a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd> <h2 id> <h3 id> <h4 id> <h5 id> <h6 id>
  • 自动断行和分段。
  • 网页和电子邮件地址自动转换为链接。

相关推荐
  • 何为最佳?数据科学简历上什么最有价值?
    全文共1572字,预计学习时长4分钟 图源:unsplash 近年来,数据科学发展迅猛。数据创造价值的潜力吸引了众多企业,推动了该领域的新投资。与此同时,社会对数据科学家的需求日益增长,许多人跳槽到该领域工作。 有抱负的数据科学家面临的最大挑战是如何迈出第一步。笔者认为难以迈出第一步有以下原因: · 数据科学是一个跨学科的领域,很难掌握和评估所需的技能。 · 数据科学仍在发展,在传统的教育体系中还没有很好地建立起来。 · 如果之前没有相关的工作经验,想证明自己的能力不是件容易的事。 在本文中,笔者将详细阐述第三个原因并提出建议。 如果关注过数据科学相关的媒体出版物,那么你肯定读过那种文章——它们列出了一串可写进简历里的数据科学项目。这些项目都非常适合锻炼硬性技能,例如编码,数据整理,数据科学库和框架,机器学习算法等。但是,其中缺乏一项重要技能。 发明魔方的能力和破解魔方的能力,可以拿来比较么?数据科学家指出问题并提出相应的解决方案。这些文章中列出的项目给你展示了问题和解决方案。此外,用整洁干净的格式获取所需数据相对容易。 图源:unsplash 大多数项目都非常普通,可以通过网络轻松地找到解决方案或实施方法,你可以将它们视为锻炼技能的项目。不过,这些项目还不足以向招聘经理证明你是数据科学家职位的理想人选。 相反,我们应该做的是找到可以用数据解决的问题并设计解决方案。问题不必太复杂
  • 程序员的使命:成为更好的问题解决者
    全文共3034字,预计学习时长8分钟 图源:unsplash 你可能也得到过这样的建议:要想成为一个更好的问题解决者,你需要解决更多的问题。但这个建议过于简单,要想精通任何一件事,不能仅仅是简单的重复,重要的是解决方法。 很多程序员听到“解决更多问题”这样的建议时,会将“更多”误认为是“更快”的意思,这也是我刚开始时犯过的一个错误。 仅仅重复做着解决问题的单调工作对提高个人的学习和水平没有益处。一开始时,我只专注于快速解决一个问题,然后赶快转到下一个。久而久之,这种做法的弊端很快就显现出来了。由于过分关注数量,我牺牲了工作的质量,还错过了在此过程中学习关键方法和经验的机会。 这并不是说重复不重要,其实它很重要。单靠重复并不能触及问题的核心,但解决问题的过程却可以。 我想把解决问题这方面完成得更好,从而提高我作为一名程序员的技术水平。所以本文里我将提出解决方案,当然,这个过程中需要大量的重复工作。 1.在各种平台上解决各种问题 “刚开始学习编程时,我迷上了HackerRank。”我的一门Python课的老师如是说。虽然有一个偏好的平台没有什么问题,但最好不要把自己限制在一个平台上,因为你需要为所有事情做好准备。 我的目标之一是能在不同的问题类型和不同平台之间顺利切换。Interview Cake上的问题与鲁文·勒纳《Python训练》中的问题是不一样的;同样,我发现勒纳的
  • 未来已来:5G用户会在2025年达到26亿吗?
    全文共3158字,预计学习时长11分钟 图源:unsplash 关于5G的讨论已经持续许多年了,从概念化到测试,再到实际实施,热度不减。2019年,5G终于在官方启动了发布。如果爱立信移动市场报告是一个目标趋势,那么5G的成长速度将比我们想象中更快。截至2019年第四季度,5G用户总数接近1300万。 迄今为止,来自全球各地的50个服务提供商已承诺在2020年推出5G服务,但是新冠疫情却限制了其在全球范围内的推广。一些人受到了阴谋论的影响,破坏5G基站的行为愈演愈烈。 关于阴谋论的传言越来越多,世界卫生组织不得不出来辟谣,甚至推特也开始在将5G与新型冠状病毒联系起来的推文上添加事实核查标签。 早期实验与大器晚成 新冠疫情发生前,来自世界各地的几个国家已经在大规模启用5G。在韩国,2019年4月以来,所有电信运营商一直在运行商业5G服务。到2020年3月,韩国的5G用户已超过500万。同样,现在瑞士约有90%的人口可以使用5G。 就东南亚和大洋洲而言,5G网络推广已经在进行中。在澳大利亚,5G可用于移动宽带以及固定无线服务。东南亚国家也已经进行了5G试验,一些市场正在等待频谱分配,为的是可以正式启动5G。除了5G,东南亚和大洋洲地区的智能手机订购量也有望在2025年突破10亿大关。 爱立信称,到2025年,最低的5G普及率将来自中东和非洲(7%),拉丁美洲(11%)和印度(11%)
  • 疫苗是什么做的?解码Moderna公司新冠疫苗成分表
    全文共1563字,预计学习时长4分钟 图源:Google 最近的报告表明,Moderna公司的mRNA-1273疫苗预防新冠肺炎感染的有效率超过94%。这是今年这个黑暗而又充满挑战的一年中的一束光。既然疫苗即将推出,那就让我们一起来看看成分表吧。 基本知识 Moderna公司研发的疫苗mRNA-1273是一种抗新型冠状病毒的信使核糖核酸(mRNA)疫苗,是由脂质纳米粒(LNP)包裹的RNA链组成。 当这些颗粒注射到体内时,会融合到人体细胞的细胞膜上,包裹在颗粒中的mRNA就会进入细胞并被翻译成病毒蛋白质。这些蛋白质一旦产生,它们就被我们自身细胞内的原生小泡包裹起来,并释放到细胞外。病毒蛋白释放时,我们的免疫系统就可以产生对应的抗体。 脂质纳米粒技术 如果说mRNA是疫苗的“信息”,那么脂质纳米颗粒就是“信封”,脂质纳米粒是在人体细胞的细胞膜上形成的,它能够在体内传播,并与人体细胞融合。mRNA-1273疫苗的脂质壁由四种不同的化合物组成: · SM-102——一种专有磷脂,是构成纳米颗粒壁的基本结构 · DSPC——另一种可获得的商用磷脂,助力纳米颗粒的壁结构 · 胆固醇——胆固醇存在于人体所有的细胞膜中,根据温度的不同,胆固醇有助于增加细胞膜的流动性或硬度。加入胆固醇能提高纳米颗粒的稳定性。 · PEG-2000 DMG——一种融于聚乙二醇的脂质,能帮助纳米颗粒的形成。 mRNA
  • 最新文本分类大综述-从1961-2020年文本分类自浅入深的发展
    最新文本分类综述:《A Survey on Text Classification: From Shallow to Deep Learning》 摘要。文本分类是自然语言处理中最基本的任务。由于深度学习的空前成功,过去十年中该领域的研究激增。已有的文献提出了许多方法,数据集和评估指标,从而需要对这些内容进行全面的总结。本文回顾1961年至2020年的文本分类方法,重点是从浅层学习到深度学习的模型。根据所涉及的文本以及用于特征提取和分类的模型创建用于文本分类的分类法。然后,详细讨论这些类别中的每一个类别,涉及支持预测测试的技术发展和基准数据集。并提供了不同技术之间的全面比较,确定了各种评估指标的优缺点。最后,通过总结关键含义,未来的研究方向以及研究领域面临的挑战进行总结。 文本分类流程。在许多NLP应用中,文本分类-为文本指定预定义标签的过程-是一项基础而重要的任务。文本分类的主要流程:首先是预处理模型的文本数据。浅层学习模型通常需要通过人工方法获得良好的样本特征,然后使用经典的机器学习算法对其进行分类。因此,该方法的有效性在很大程度上受到特征提取的限制。但是,与浅层模型不同,深度学习通过学习一组非线性变换将特征工程直接集成到输出中,从而将特征工程集成到模型拟合过程中。 文本分类发展历程。主要文本分类方法的示意图如图2所示。从1960年代到2010年代
  • 最新文本分类大综述-从1961-2020年文本分类自浅入深的发展
    最新文本分类综述:《A Survey on Text Classification: From Shallow to Deep Learning》 摘要。文本分类是自然语言处理中最基本的任务。由于深度学习的空前成功,过去十年中该领域的研究激增。已有的文献提出了许多方法,数据集和评估指标,从而需要对这些内容进行全面的总结。本文回顾1961年至2020年的文本分类方法,重点是从浅层学习到深度学习的模型。根据所涉及的文本以及用于特征提取和分类的模型创建用于文本分类的分类法。然后,详细讨论这些类别中的每一个类别,涉及支持预测测试的技术发展和基准数据集。并提供了不同技术之间的全面比较,确定了各种评估指标的优缺点。最后,通过总结关键含义,未来的研究方向以及研究领域面临的挑战进行总结。 文本分类流程。在许多NLP应用中,文本分类-为文本指定预定义标签的过程-是一项基础而重要的任务。文本分类的主要流程:首先是预处理模型的文本数据。浅层学习模型通常需要通过人工方法获得良好的样本特征,然后使用经典的机器学习算法对其进行分类。因此,该方法的有效性在很大程度上受到特征提取的限制。但是,与浅层模型不同,深度学习通过学习一组非线性变换将特征工程直接集成到输出中,从而将特征工程集成到模型拟合过程中。 文本分类发展历程。主要文本分类方法的示意图如图2所示。从1960年代到2010年代
  • 如何在JavaScript中将数值转换为Boolean
    全文共1396字,预计学习时长7分钟 图源:unsplash JavaScript中如何将数值转换为Boolean?这篇文章帮你搞定!往下看吧~ 字符串 conststring = 'string';!!string; // true Boolean(string); // true 数值 constnumber = 100;!!number; // true Boolean(number); // true 虚值 在JavaScript中,有6个虚值。如果将其中任何一个字符串转换为Boolean,它将变为false 。 false undefined null NaN 0 "" (empty string) 任何不为虚值的都会转换为true。 示例 虚值的应用: !!false;// false !!undefined; // false !!null; // false !!NaN; // false !!0; // false !!''; // false 虚值在Boolean上下文中的应用: Boolean(false);// false Boolean(undefined); // false Boolean(null); // false Boolean(NaN); // false Boolean(0); // false Boolean(''); // false
  • 阿里云小蜜对话机器人背后的核心算法
    导读:阿里小蜜智能对话开发平台是智能服务事业部推出的面向各行各业的对话构建平台,此次分享将结合平台,对小样本下的语言理解、用户模拟器和基于模型的对话管理的算法研究和落地进行介绍。▌0. 对话系统简介对话系统的一般架构如图:图1:对话系统一般架构这是我们所熟知的对话系统框架,这里面主要有:NLU 自然语言理解,DM 对话管理,NLG 自然语言生成3个主要模块,DM 里面有 dialog state tracking 用于对话状态追踪,policy 用于对话策略管理。当我们在执行一个对话任务时,例如“开发票”,系统不仅要识别用户的需求,还需要与外部系统对接,进行订单号的合法性校验,调用开发票接口等,这时候 DM 不仅要完成与用户的交互、管理槽位信息,还需要访问外部接口,管理调用的结果。图2:完整的对话系统架构当构建好一个机器人后,还需要进行对话的诊断,效果评测,才能发布上线,如果这些工作全都让人来完成,整个过程会非常费力,于是我们引入了用户模拟器来提高整体交付效率。图3:用户模拟器应用到对话系统云小蜜对话机器人核心算法主要包括三部分:1. 自然语言理解;2. 对话管理;3. 用户模拟器。▌1. 自然语言理解由于云小蜜对话机器人需要满足各行各业各种场景下的对话服务需求,所以我们的自然语言理解是平台视角下的自然语言理解。根据训练样本的多少,我们把它分为3种不同的情况:无样本、小样本、多样本
  • 人工智能7大关键技术,终于有人讲明白了
    01~03 统计机器学习、神经网络和深度学习机器学习是一种自动将模型与数据匹配,并通过训练模型对数据进行“学习”的技术。机器学习是AI最常见的形式之一。在2017年德勤对250位经理(其所在公司都已经在探索AI)开展的“了解认知”调查中,接受调查的公司58%在其业务中采用了机器学习。它是许多人工智能方法的核心技术并且有很多的版本。公司内部和外部数据(尤其是这些外部数据)的爆炸式增长使它们采用机器学习来全面理解这些数据变得既可行又必要。神经网络是机器学习的一种更为复杂的形式,该技术出现在20世纪60年代,并用于分类型应用程序,例如确定信贷交易是否为欺诈行为。它根据输入、输出、变量权重或将输入与输出关联的“特征”来分析问题。它类似于神经元处理信号的方式,但把它比作大脑就有些牵强了。最复杂形式的机器学习将涉及深度学习,或通过很多等级的特征和变量来预测结果的神经网络模型。得益于当前计算机架构更快的处理速度,这类模型有能力应对成千上万个特征。与早期的统计分析形式不同,深度学习模型中的每个特征通常对于人类观察者而言意义不大。这导致的结果就是该模型的使用难度很大或者难以解释。在德勤的调查中只有34%的人在使用深度学习技术。深度学习模型使用一种称为反向传播的技术,通过模型进行预测或对输出进行分类。AI技术已推动了该领域的许多最新进展,从在围棋大赛中击败人类专家到对互联网图像进行分类
  • 机器之心独家专访:首度揭秘地平线语音战略与研究
    从创立之初,地平线的愿景就是为包括智能家电、服务机器人、自动驾驶汽车在内的众多设备装上「大脑」,让它们具有从感知、交互、理解到决策的智能。人机之间的自然交互一直是人工智能领域的一个美好愿景,而语音是人机交互中最重要的手段之一。虽然过去的一年中,我们听到更多的是地平线关于图像、芯片方面的研究,但据机器之心了解,地平线在创立之初(2015 年)就拥有了一支十分强大的语音团队,很早就在进行语音方面的研究,积累起独特的技术优势。在近日,机器之心对地平线联合创始人、算法副总裁黄畅博士以及首席语音算法工程师牛建伟进行了专访,从公司的整体战略、语音技术两个角度揭开地平线语音的神秘面纱。黄畅博士,地平线机器人技术联合创始人、算法副总裁。深度学习专家,前百度主任架构师 ( T10 )。长期从事计算机视觉、机器学习、模式识别和信息检索方面的研究,作为相关学术界和工业界的知名专家,发表的论文被引用超过 3350 次,拥有多项国际专利。他开发的人脸检测技术,创造了世界上首次计算机视觉技术被大规模应用的成功范例,占领 80% 数码相机市场,并且被苹果 iPhoto 等诸多图像管理软件所采用。 牛建伟,地平线机器人技术首席语音算法工程师、语音识别团队负责人。牛建伟毕业于西北工业大学语音识别专业。曾任百度语音技术部资深工程师,在百度期间研发了国内第一个采用深度学习技术的大规模商用语音识别系统
  • 数据科学正在进入“无代码”的新时代
    即使仅仅过去了一周,也有一些我们不知道的新的自动化 / 无代码技术推出。有的是新成立的初创公司带来的整合产品。但更多的是现有的分析平台提供商增加的新功能或模块。从这些自动化机器学习(AML)平台出现以来,我就一直在关注它们。在 2016 年春天,我第一次写文章讨论这些平台,标题为“到 2025 年,自动化技术会让数据科学家失业!”。当然,这绝对不是我夸大其词,在过去的两年半内,自动化功能在我们行业中的传播速度是惊人的。无代码数据科学无代码数据科学,或者叫自动化机器学习,或者像 Gartner 所述的那样,“增强版”数据科学提供了一些便捷的工具。包括:向导平台:提供详细建模步骤的平台(但仍然需要用户来做这些步骤,比如说 BigML、SAS、Alteryx)。该平台是基于经典的拖放平台理念而设计的。自动化机器学习(AML):全自动化机器学习平台(比如 DataRobot)。会话分析:在最近的版本中,用户只需要用普通英语提出需要解决的问题,平台就会给出最佳答案,选择数据、功能、建模技术甚至最佳数据可视化。这个列表还很好地阐述了发展时间表。向导平台已经过时了。AML 平台越来越多,越来越成熟。会话分析刚刚起步。不仅仅是为了深入分析工具的智能发展不限于预测 / 规范建模,而是扩展到数据混合和准备阶段,甚至是数据可视化领域。这意味着,传统的 BI 业务分析师,当然还有用户业务线经理
  • 解锁宇宙密码:为什么是3、6、9?
    全文共3440字,预计学习时长9分钟 图源:unsplash 几年前,我的室友克里斯多夫邀请我和他一同出席一个生日派对。走进哥伦比亚大学宽敞的公寓,短短几秒我就发现,除了我和另一个姓吴的同学,这里都是些神经科学专业的研究生。 克里斯多夫对他打招呼道,“嗨,这是我的室友,一位天才!” 吴伸出手,微笑着说,“克里斯多夫说你是现实生活中的天才,是吗?” 特斯拉对自然算法的洞察 我耸了耸肩,他语气里的不善表明他并不买账,后来我才得知吴那时即将进入纽约大学攻读计算机科学博士学位。吴不擅闲聊,但他实在按捺不住自己的好奇心。 他说:“嗯哼,这位天才。你要如何证明自己的博学?” 我咕哝着说出萨根那句名言,“非凡的断言需要有非凡的证据。” 我天生就是个喜欢出风头的人。我让克里斯多夫把计时器调成五分钟,房间中的嗡嗡声促使其他人围了过来。我和吴对视了一眼:“请你说一句——好戏开始了。”吴搓着手,脸上闪过一丝微笑:“好戏开始了!” 下文总结了我派对当晚的演讲,大意是对我那时已完成的纯数学代码成果的总结。 宇宙蓝图 爱因斯坦认为大自然给宇宙设定了一种通用密码。 尼古拉·特斯拉是历史上最伟大的发明家,他曾说“如果你了解3,6,9的美妙之处,你就拥有通往宇宙实像的钥匙。” 很少有人真正理解这句神秘的话。 我的专业背景是哲学,哲学家威尔弗里德·塞拉斯对这门学科有一个极为深刻的定义,他认为哲学的目标是
  • 今天的卷积网络,Yann LeCun在93年就已经玩得很溜了
    手写数字识别是很多人入门神经网络时用来练手的一个项目,但就是这么简单的一个项目,最近在 reddit 上又火了一把,因为在 MIT 计算机科学和人工智能实验室,有人挖到了一个「祖师爷」级别的视频……https://v.qq.com/x/page/p32191o2g0v.html这段视频录制于 1993 年,主人公是图灵奖得主 Yann LeCun(杨立昆)。彼时 LeCun 才 32 岁,刚刚进入贝尔实验室工作,而视频里机器学习识别的第一段数字 201-949-4038,是 LeCun 在贝尔实验室里的电话号码。从这段视频中我们可以看到,LeCun 在 90 年代初创造的文本识别系统已经达到了惊人的速度和准确率,这在当时的条件下是非常难能可贵的。这段视频由贝尔实验室自适应系统研究部门主任 Larry Jackel 拍摄(Larry 当时是 LeCun 的 boss,现任英伟达自动驾驶顾问)。视频中出镜的还有实验室负责人 Rich Howard(Larry 的 boss)和研究工程师 Donnie Henderson。Yann LeCun 本人表示:「Donnie Henderson 将整个演示系统整合在了一起…… 整套系统在算力为 20MFLOPS 的 DSP 版上运行。」几位工程师在视频中洋溢的笑容也颇具感染力。LeCun 表示,1993 年的文字识别系统已经用上了卷积神经网络
  • 开课吧python怎么样-廖雪峰官方大数据分析课程,第七期对外开放,前20名直降2000元!!!...
    数据分析是程序员或者机器学习从业者最基本的一项技能,对数据进行掌握了解可以迅速抓住业务主线和数据特征! 关于数据分析的学习资料网上一抓一大把,但是一提项目实践,很多人表示手上没有数据源,不知道完整的一套数据分析流程是怎样的,分析起来更是手忙脚乱,很难独立进行一项完整的数据分析项目。 别急,开课吧邀请到 技术大牛 廖雪峰和 竞技世界首席数据科学家 巴川 历时半年联手打造了一门 深度对标阿里P7 级别的课程 《大数据分析全栈工程师》 ,特别适合对大数据分析感兴趣想要入门提高的人学习。 廖雪峰 : IT技术大牛 曾任职西门子、摩托罗拉、火币网等知名公司高级技术专家; 畅销书《spring2.0核心技术与最佳实践》的作者,其官方网站及博客是很多技术人常用的参考教程,日访问量达5万+。 巴川: 竞技世界首席数据科学家 中国计算机学会技术前线委员会(CCFTF)数据科学SIG主席; 中国教育创新校企联盟首席数据科学家、专家委员会副主任; 曾就职于中国搜索、搜狐畅游等一线互联网公司,TOP100全球软件案例研究峰会、A2M人工智能与机器学习创新峰会、中国数据分析师行业峰会、DTCC中国数据库技术大会等会议主要演讲嘉宾及出品人。 为什么敢说对标阿里P7?因为我们所言不虚! 廖雪峰联手首席数据科学家巴川亲手打造 两位大牛带领研发团队 200多份一线互联网企业真实的用人需求 中筛选高频主流技能
  • 开课吧python怎么样-廖雪峰官方大数据分析课程,第七期对外开放,前20名直降2000元!!!...
    数据分析是程序员或者机器学习从业者最基本的一项技能,对数据进行掌握了解可以迅速抓住业务主线和数据特征! 关于数据分析的学习资料网上一抓一大把,但是一提项目实践,很多人表示手上没有数据源,不知道完整的一套数据分析流程是怎样的,分析起来更是手忙脚乱,很难独立进行一项完整的数据分析项目。 别急,开课吧邀请到 技术大牛 廖雪峰和 竞技世界首席数据科学家 巴川 历时半年联手打造了一门 深度对标阿里P7 级别的课程 《大数据分析全栈工程师》 ,特别适合对大数据分析感兴趣想要入门提高的人学习。 廖雪峰 : IT技术大牛 曾任职西门子、摩托罗拉、火币网等知名公司高级技术专家; 畅销书《spring2.0核心技术与最佳实践》的作者,其官方网站及博客是很多技术人常用的参考教程,日访问量达5万+。 巴川: 竞技世界首席数据科学家 中国计算机学会技术前线委员会(CCFTF)数据科学SIG主席; 中国教育创新校企联盟首席数据科学家、专家委员会副主任; 曾就职于中国搜索、搜狐畅游等一线互联网公司,TOP100全球软件案例研究峰会、A2M人工智能与机器学习创新峰会、中国数据分析师行业峰会、DTCC中国数据库技术大会等会议主要演讲嘉宾及出品人。 为什么敢说对标阿里P7?因为我们所言不虚! 廖雪峰联手首席数据科学家巴川亲手打造 两位大牛带领研发团队 200多份一线互联网企业真实的用人需求 中筛选高频主流技能
  • 今天的卷积网络,Yann LeCun在93年就已经玩得很溜了
    卷积神经网络的成功是否超出了其发明者的想象?Yann LeCun 说:「是的,我们一直在尝试更加疯狂的写法,而它的进步却从未中断过。」手写数字识别是很多人入门神经网络时用来练手的一个项目,但就是这么简单的一个项目,最近在 reddit 上又火了一把,因为在 MIT 计算机科学和人工智能实验室,有人挖到了一个「祖师爷」级别的视频……https://v.qq.com/x/page/p32191o2g0v.html这段视频录制于 1993 年,主人公是图灵奖得主 Yann LeCun(杨立昆)。彼时 LeCun 才 32 岁,刚刚进入贝尔实验室工作,而视频里机器学习识别的第一段数字 201-949-4038,是 LeCun 在贝尔实验室里的电话号码。从这段视频中我们可以看到,LeCun 在 90 年代初创造的文本识别系统已经达到了惊人的速度和准确率,这在当时的条件下是非常难能可贵的。这段视频由贝尔实验室自适应系统研究部门主任 Larry Jackel 拍摄(Larry 当时是 LeCun 的 boss,现任英伟达自动驾驶顾问)。视频中出镜的还有实验室负责人 Rich Howard(Larry 的 boss)和研究工程师 Donnie Henderson。Yann LeCun 本人表示:「Donnie Henderson 将整个演示系统整合在了一起…… 整套系统在算力为 20MFLOPS
  • 文本分类综述-A Survey on Text Classification: From Shallow to Deep Learning
    转载自:2020最新文本综述:从浅层到深度学习-计算机视觉研究院 文本分类是自然语言处理中最基本的任务。由于深度学习的空前成功,过去十年中该领域的研究激增。已有的文献提出了许多方法,数据集和评估指标,从而需要对这些内容进行全面的总结。本文回顾1961年至2020年的文本分类方法,重点是从浅层学习到深度学习的模型。根据所涉及的文本以及用于特征提取和分类的模型创建用于文本分类的分类法。然后,详细讨论这些类别中的每一个类别,涉及支持预测测试的技术发展和基准数据集。并提供了不同技术之间的全面比较,确定了各种评估指标的优缺点。最后,通过总结关键含义,未来的研究方向以及研究领域面临的挑战进行总结。 2、文本分类流程 在许多NLP应用中,文本分类-为文本指定预定义标签的过程-是一项基础而重要的任务。文本分类的主要流程:首先是预处理模型的文本数据。浅层学习模型通常需要通过人工方法获得良好的样本特征,然后使用经典的机器学习算法对其进行分类。因此,该方法的有效性在很大程度上受到特征提取的限制。但是,与浅层模型不同,深度学习通过学习一组非线性变换将特征工程直接集成到输出中,从而将特征工程集成到模型拟合过程中。 3、文本分类发展历程 主要文本分类方法的示意图如图2所示。从1960年代到2010年代,基于浅层学习的文本分类模型占主导地位。浅层学习意味着基于统计的模型,例如朴素贝叶斯(NB),K近邻(KNN
  • 别客气,11种在教程中难以找到的JavaScript技巧,请收下
    全文共3721字,预计学习时长11分钟 来源:Pexels 今天,小芯给大家整理11条非常好用的JavaScript技巧。 买不了吃亏,买不了上当,快来看看吧~ 1.获取数组的最后一项 设置起始参数和终止参数时,Array.prototype.slice(begin,end)具有剪切数组的功能。但是,如果未设置终止参数,该功能将自动设置为数组的最大值。 该功能可接受负值,我想很多人对此并不了解,而且如果将起始参数设定为负数,那么会得到数组的最后几个元素: vararray = [1,2,3,4,5,6];console.log(array.slice(-1)); // [6]console.log(array.slice(-2)); // [5,6]console.log(array.slice(-3)); // [4,5,6] 2.用||运算符默认某值 目前的ES6有默认参数功能。为了在旧版浏览器中模拟该功能,你可以用||(OR运算符)默认某值,将其作为第二个可用的参数。 如果第一个参数返回到了false,那么第二个参数就会被视为默认值。请看这个例子: function User(name, age) {this.name = name || "OliverQueen";this.age = age || 27;}var user1 = new User();console
  • AI Talk | 小度战平人类最强大脑后,我们和吴恩达聊了聊
    继上周五百度的小度机器人在《最强大脑》节目中的跨年龄人脸识别任务中击败了人类顶级选手后,周五晚上,小度再次在声纹识别任务上迎战了人类最强大脑,并最终以 1:1 的成绩和人类打成了平手。节目之后,机器之心对百度首席科学家吴恩达进行了独家专访,请他谈论了小度在这场比赛中所用到的技术、百度的人工智能研究和团队以及他对中国和世界人工智能研究的思考。https://v.qq.com/x/page/e0366l4b003.html作为机器之心新栏目 AI Talk 的一部分,我们对这次视频专访的内容进行了剪辑,完整采访可见下面文字整理版本。关于小度和声音/语音技术机器之心:简单介绍一下,小度在本期节目中使用到的识别技术及其原理?吴恩达:在比赛中,小度使用了 2 种前沿的声纹识别算法,为了识别出某个人,会把两种算法的结果结合在一起。其中一种方法是基于卷积神经网络,这是一种端对端的方式。卷积网络把输入切成声音片段,然后尝试识别这些片段是不是来自同一个人。这个神经网络是在 2 万多人的大约 5000 多小时的音频数据上训练出来的。这是一个很大的音频数据集,它使得神经网络变得相当准确。我们的第二个系统也有神经网络,但结构不同。第二个系统采用声音片段作为输入,神经网络输出 5000 维表征语音,并基于此进行统计建模。通过统计建模后的结果,抽离出说话人相关的信息,选择出 500 个特征来表征说话人的属性
  • 人工智能的2020:泡沫破灭?还是最后的狂欢?
    本文3560字,建议阅读9分钟。 本文对人工智能在2020年的发展态势进行分析。 对付泡沫的有效方法,就是用另一个更大的泡沫包住它,这也是常说的「嵌套式泡沫」。 如果要追求可持续繁荣,必须要同时做到两件事:小心地把里面的虚假消掉、认真地把外面的空间做大。 身处人工智能巨轮上的我们,越来越频繁地听人谈论起人工智能过快增长而导致泡沫丛生,独角兽越来越多,但跑出资本怪圈独立生长的却寥寥无几。 对于即将到来的 2020,前景谈不上明朗,巨轮究竟将驶向何方? 几乎所有参与人工智能的玩家都已经意识到,AI 就像加速器。 比如,AI 与「互联网复古风口」RPA (自动化) 结合,成就了 IPA(智能流程自动化)。将 RPA 比作人的双手,AI 比作人的大脑,IPA 就是把 AI 作为大脑去指挥 RPA 这双灵巧的双手来完成工作。 然而,AI 绝不仅仅是一场指挥大脑的游戏。 更重要的是,AI 已经从单一应用集成到企业的方方面面,重塑其在整个产业链中的位置。 最近,全球两家领先的市场研究与咨询机构 IDC 和 Forrester 发布了他们对 2020 年及以后人工智能产业化的预测。 通过 IDC 和 Forrester 的调查和预测,我们可以看到的未来是: 1)是否存在高技能工程师的差异,将在不同公司之间筑起一道「数字鸿沟」。 2)三大公关灾难将让 AI「声名狼藉」:Deepfake 的广泛传播