如何高效清洗数据?试试这款神器

news/2024/7/11 0:45:32 标签: 数据分析, jquery

在大数据时代,数据的来源具有多样性、复杂性。

针对数量庞大、渠道及格式多样的数据,数据清洗就成为刚需。

数据分析中,数据清洗实际上是十分繁重且关键的一步。

Power Query作为数据清洗的工具,能将这些多源的数据集中并统一转换成所需要的格式,为数据分析创造前提条件。

此外,Power Query还能使办公自动化更进一步,与常用办公软件Excel无缝衔接,使日常的重复工作实现自动化,得到高效并准确的处理结果,不仅可以为企业节省人力成本,还可以为个人节省时间。

在未使用Power Query之前,《Power Query实战:Excel智能化数据清洗神器应用精讲》一书的作者常用的是Excel中的函数,但是自从使用了Power Query,很多在Excel中看似困难的操作只需要进行简单的处理即可完成,甚至都不需要自己编写函数,直接在操作界面中操作即可。

在这里插入图片描述

对于没有编程经验的人来说,使用Power Query的关键就是搞清楚数据的格式,如果理解了这一点,那么在使用函数的过程中会容易很多。

本书特色

Power Query中的函数多达几百个,选择案例中介绍的那些常用的函数并熟练运用,基本上可以解决工作中遇到的大部分问题。

本书不仅说明了操作过程,还帮助读者拓展思路,使读者能够举一反三地来解决问题;同时,通过丰富的案例对函数的计算过程进行详细解释,使读者能够更好地理解函数的计算过程,更清楚函数的计算逻辑。


本书读者对象

经常使用Excel的办公人员

经常需要整合各个渠道数据的人员

经常需要生成不同报表的统计人员

企业运营管理及分析人员

做市场分析的统计人员

其他对数据整理及分析感兴趣的人员


本书内容

第1章:主要介绍Power Query的一些基本概念,如Power Query的作用、打开方式、主界面功能、数据类型、函数概况、基础语法、数据的引用方式等。

第2章:介绍Power Query中从多种数据源导入数据的方法,如从Excel工作簿、工作表、表格、文本文件、文件夹、MySQL数据库、Web页面及其他数据源导入数据。

第3章:以自制文件管理器作为案例,通过数据的获取、提取、判断和筛选等方式来熟悉一些基本操作,最后利用批处理文件来批量移动、复制、删除和重命名文件。

第4章:对比Excel中的条件计算公式,了解Power Query中的数据自动化清洗计算功能。

第5章:对比Excel中的数据去重及数据匹配功能,了解Power Query中VLOOKUP匹配函数的实现方法。

第6章:对比Excel中提取文本中数据的方法,了解Power Query中功能更强大的提取方式,包括提取任意数字、英文、符号及指定国家语言字符等。

第7章:对比Excel中的绝对引用和相对引用,了解在Power Query中实现相对引用、绝对引用和混合引用的方法。

第8章:以电商平台批量上传产品数据表作为案例,通过分析目标表格式,介绍如何使用Power Query对源数据表格进行清洗并达到目标表格式的要求,以及如何处理标题内容和列的顺序不符合要求的表格。

第9章:以库存的断码缺货及补货作为案例,通过Power Query对数据进行清洗,使其能自动显示断码缺货的情况及补货的需求。

第10章:对比Excel中的“分列”功能,Power Query中“拆分列”功能的规则具有多样性,不仅可以按分隔符、按字符数、按位置来拆分列,还可以按照既有规则转换拆分列,以及自定义规则转换拆分列(如中文转英文、英文转数字等)。

第11章:使用Power Query对合并单元格的数据进行处理,使其成为可用于分析的数据,包括列标题的合并、行标题的合并、数据值的合并等。

第12章:主要介绍Power Query中时间类函数的应用、日期及时间类函数的主要分类、日期格式的互相转换等,以排班表和账期计算作为案例来充分展示时间类函数的应用。

第13章:主要介绍如何提取带有table标签的网页数据,如何对JSON格式的数据进行清洗,以及如何提取代码中的指定数据。

第14章:主要介绍Power Query中的函数概念、自定义函数的备注,以及自定义函数实战。

第15章:使用Power Query进行人工智能开发,通过解读开放文档中的说明,连接开放的API,使数据处理更加智能化。

在这里插入图片描述
在这里插入图片描述

限时五折优惠,快快抢购吧!
每日抽奖
奖品《学习的学问》

在这里插入图片描述


http://www.niftyadmin.cn/n/221600.html

相关文章

【数据分析】— 特征工程、特征设计、特征选择、特征评价、特征学习

【数据分析】— 特征工程特征工程是什么? (Feature Engineering)特征工程的意义特征工程的流程特征的设计从原始数据中如何设计特征?基本特征的提取创建新的特征函数变换特征独热特征表示 One-hot Representation数据的统计特征TF-IDF(词频-逆…

vue-element-admin-master编译异常记录

前言 最近一直在往大前端的方向转,不得不说前端的知识架构还真的很庞大,一步一个脚印吧,之前消化完极简版后台项目[vue-admin-template-master]后,开始想看下完整版的后台[vue-element-admin-master]项目,奈何clone项…

Chapter3-用适合的方式发送和接收消息

3.1 不同类型的消费者 消费者可分为两种类型。 一个是DefaultMQPushConsumer ,由系统控制读取操作,收到消息后自动调用传人的处理方法来处理;另 一个是 DefaultMlConsumer ,读取操作中的大部分功能由使用者自主控制 。 3.1.1 Def…

如何快速开发软件?这篇文章说明白了

随着经济迅速发展,传统软件开发模式存在研发周期长、需求转化困难、投入成本高等问题,无法适应当前业务发展速度,市场需要快速开发工具。快速开发软件可分为代码生成类、少代码类、零代码功能配置类。代码生成类相对灵活,但对用户要求高&…

海睿思分享 | 制造业数字化转型之业务场景驱动

在开始谈业务场景驱动之前,我们先介绍一下流程驱动和数据驱动的概念。 首先数据和流程在现代制造业相辅相成,流程中有数据,数据往往通过流程传递,而“驱动”是通过建立一定的驱动机制,改变以往人为的业务推进模式&…

VRRP路由器

拓扑图 PC2的网关为40.1.1.2或者40.1.1.1 步骤一: r1配置 [Huawei]interface GigabitEthernet 0/0/1 [Huawei-GigabitEthernet0/0/1]ip address 10.1.2.1 255.255.255.0 [Huawei-GigabitEthernet0/0/1]interface GigabitEthernet 0/0/2 [Huawei-GigabitEthernet0/…

pcl官方教程笔记

http://pointclouds.org/documentation/ https://pcl.readthedocs.io/projects/tutorials/en/master/walkthrough.html#filters https://zhuanlan.zhihu.com/p/268524083 overview 滤波 根据输入点与周围点距离,统计。计算平均距离。 通过假设得到的分布是具有均…

浅谈一下socks5协议原理详解与应用场景分析

SOCKS5协议是一种网络传输协议,主要用于代理服务器和客户端之间的通信。它能够通过认证授权等多种方式,提供安全可靠的代理服务,适用于各种应用场景。 SOCKS5协议原理: 1.连接建立:客户端向代理服务器发送连接请求&…