炫意html5
最早CSS3和HTML5移动技术网站之一

Python数据分析 – Python数据分析教程

牛青阅读(90)

Python简介 Python是一种跨平台的计算机程序设计语言,是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。Python很适合用来做数据分析,近年来,越来越多的从业人员使用Python来做数据工作,围绕数据分析的生态也越...

Python数据分析 – Python数据分析简介

阿喜阅读(103)

为什么要用Python? 基于Python语言的特性,加上历史和文化上的原因,Python发展出了一个大型、活跃的科学计算及数据分析社区。近些年,Python提高了对数据类库的支持,使得它成为数据分析任务的一个流行选择。再综合考虑Pytho...

Python数据分析 – NumPy数值计算基础

无卤阅读(85)

NumPy数值计算基础 NumPy是用于数据科学计算的基础模块,不但能够完成科学计算的任务,而且能够被用作高效的多维数据容器,可用于存储和处理大型矩阵。NumPy的数据容器能够保存任意类型的数据,这使得NumPy可以无缝并快速地整合各种数据...

Python数据分析 – NumPy数组对象ndarray

牛青阅读(85)

掌握Numpy数组对象ndarray Python提供了一个array模块。array 和list 不同,它直接保存数值,和C语言的一维数组比较类似。但是由于Python的array模块不支持多维,也没有各种运算函数,因此也不适合做数值运算...

Python数据分析 – NumPy矩阵与通用函数

无卤阅读(82)

掌握NumPy矩阵与通用函数 NumPy对于多维数组的运算,默认情况下并不进行矩阵运算。如果需要对数组进行矩阵运算,则可以调用相应的函数。 1、创建NumPy矩阵 在NumPy中,矩阵是ndarray的子类。在NumPy中,数组和矩阵有着重...

Python数据分析 – 利用NumPy进行统计分析

牛青阅读(87)

利用NumPy进行统计分析 使用NumPy数组可以使你利用简单的数组表达式完成多种数据操作任务,而无须写些大量循环。这种利用数组表达式来替代显式循环的方法,称为向量化。通常,向量化的数组操作会比纯Python的等价实现在速度上快一到两个数量...

Python数据分析 – pandas统计分析基础

牛青阅读(95)

pandas统计分析基础 统计分析是数据分析的重要组成部分,它几乎贯穿了整个数据分析的流程。运用统计方法,将定量与定性结合,进行的研究活动叫作统计分析。统计分析除了包含单一数值型特征的数据集中趋势、离散趋势和峰度与偏度等统计知识外,还包含了...

Python数据分析 – pandas数据结构介绍

田田阅读(96)

pandas数据结构介绍 为了入门pandas,需要熟悉两个常用的工具数据结构:Series和DataFrame。尽管他们并不能解决所有的问题,但它们为大多数应用提供了一个有效、易用的基础。 1、Series Series是一种一维的数组型...

Python数据分析 – pandas基本功能

田田阅读(91)

基本功能 本节将会指引你了解与Series或DataFrame中数据交互的基础机制。 1、重建索引 reindex是pandas对象的重要方法,该方法用于创建一个符合新索引的新对象。考虑下面的例子: Series调用reindex方法时,会...

Python数据分析 – pandas描述性统计的概述与计算

嘿哈阅读(93)

描述性统计的概述与计算 pandas对象装配了一个常用数学、统计学方法的集合。其中大部分属于归约或汇总统计的类别,这些方法从DataFrame的行或列中抽取一个Series或一系列值的单个值(如总和或平均值)。与NumPy数组中的类似方法相...

Python数据分析 – 数据载入、存储及文件格式简介

中天阅读(88)

数据载入、存储及文件格式简介 数据读取是进行数据预处理、建模与分析的前提。不同的数据源,需要使用不同的函数读取。pandas内置了10 余种数据源读取函数和对应的数据写人函数。常见的数据源有3种,分别是数据库数据、文本文件(包括一般文本文件...

Python数据分析 – 二进制格式

yiyan阅读(78)

二进制格式 使用Python内建的pickle序列化模块进行二进制格式操作是存储数据(也称为序列化)最高效、最方便的方式之一。pandas对象拥有一个to_pickle方法可以将数据以pickle格式写入硬盘: 可以直接使用内建的pickl...

Python数据分析 – 文本格式数据的读写

喔28阅读(83)

文本格式数据的读写 将表格型数据读取为DataFrame对象是pandas的重要特性。下表总结了部分实现该功能的函数,read_csv和read_table可能是后期使用最多的函数。 这些函数的可选参数主要有以下几种类型。 索引:可以将一或...

Python数据分析 – 数据清洗与准备

中天阅读(79)

数据清洗与准备 在进行数据分析和建模的过程中,大量的时间花在数据准备上:加载、清理、转换和重新排列。这样的工作很占用时间。有时,数据存储在文件或数据库中的方式对于特定的任务来说格式并不正确。许多研究人员选择使用通用编程语言(如Python、...

Python数据分析 – 处理缺失值

小杜阅读(84)

处理缺失值 缺失数据会在很多数据分析应用中出现。pandas的目标之一就是尽可能无痛地处理缺失值。例如,pandas对象的所有描述性统计信息默认情况下是排除缺失值的。 pandas对象中表现缺失值的方式并不完美,但是它对大部分用户来说是有用...

Python数据分析 – 数据转换

无卤阅读(80)

数据转换 之前,我们主要讲解了数据的重新排列。过滤、清洗以及其他转换是另外一系列重要的操作。 1、删除重复值 由于各种原因,DataFrame中会出现重复行。请看如下例子: DataFrame的duplicated方法返回的是一个布尔值Se...

Python数据分析 – 数据规整:连接、联合与重塑

无卤阅读(84)

数据规整:连接、联合与重塑 在很多应用中,数据可能分布在多个文件或数据库中,抑或以某种不易于分析的格式进行排列。本章关注于对数据联合、连接以及重排列有用的工具。 炫意HTML5 » Python数据分析 – 数据规整...

Python数据分析 – 字符串操作

啊Q阅读(83)

字符串操作 由于Python在字符串和文本操作上的便利性,使Python成为一个流行的原生数据集操作语言已经有很长时间了。字符串对象的内建方法使得大部分文本操作非常简单。对于更为复杂的模式匹配和文本操作,正则表达式可能是需要的。 1、字符串...

Python数据分析 – 联合与合并数据集

小杜阅读(104)

联合与合并数据集 包含在pandas对象的数据可以通过多种方式联合在一起: pandas.merge根据一个或多个键将行进行连接。对于SQL或其他关系型数据库的用户来说,这种方式比较熟悉,它实现的是数据库的连接操作。 pandas.conc...

Python数据分析 – 分层索引

bigao阅读(81)

分层索引 分层索引是pandas的重要特性,允许在一个轴向上拥有多个(两个或两个以上)索引层级。笼统地说,分层索引提供了一种在更低维度的形式中处理更高维度数据的方式。先创建一个Series,以列表的列表(或数组)作为索引: 你看到的是一个以...

Python数据分析 – 重塑和透视

啊Q阅读(102)

重塑和透视 重排列表格型数据有多种基础操作。这些操作被称为重塑或透视。 1、使用多层索引进行重塑 多层索引在DataFrame中提供了一种一致性方式用于重排列数据。以下是两个基础操作: statck(堆叠)该操作会“旋转”或将列中的数据透视...

Python数据分析 – Matplotlib数据可视化基础

啊Q阅读(103)

Matplotlib数据可视化基础 制作提供信息的可视化(有时称为绘图)是数据分析中最重要任务之一。可视化可能是探索过程的一部分,例如,帮助识别异常值或所需的数据转换,或者为建模提供一些想法。Python有很多附加库可以用来制作静态或动态的...

Python数据分析 – 掌握绘图基础语法与常用参数

阿喜阅读(95)

掌握绘图基础语法与常用参数 在使用matplotlib时,我们使用以下的导入惯例: 在Jupyter中运行%matplotlib notebook(或在IPython中运行%matplotlib),我们就可以尝试生成一个简单的图形。 生成如...

Python数据分析 – 使用pandas和seaborn绘图

小杜阅读(92)

使用pandas和seaborn绘图 matplotlib是一个相当底层的工具。可以从其基本组件中组装一个图表:数据显示(即绘图的类型:线、条、框、散点图、轮廓等)、图例、标题、刻度标记和其他注释。在pandas中,我们可能有多个数据列,并...

Python数据分析 – 其他Python可视化工具

阿喜阅读(75)

其他Python可视化工具 和开源代码一样,在Python语言下创建图形的选择有很多。自2010年以来,很多开发工作都集中在创建web交互式图形上。借助像Bokeh和Plotly这样的工具,在web浏览器中创建动态的、交互式图像的工作现在已...

Java基础教程Android基础教程