使用Kettle实现数据排序

使用Kettle实现数据排序

一、Kettle的安装

1.下载Kettle的安装包文件

在Windows系统中打开浏览器,访问Kettle官网(https://sourceforge.net/projects/pentaho/),下载Kettle安装文件pdi-ce-9.1.0.0-324.zip。

或者在我的百度网盘分享里面下载

链接:https://pan.baidu.com/s/1qZ7o3MT0635kMC-ojfeUiA?pwd=huan

提取码:huan

2.解压缩安装包文件

把pdi-ce-9.1.0.0-324.zip解D:\bigdataCol\”目录下,会生成一个“data-integration”目录,该目录下就包含了Kettle。

3.在E:\bigdataCol\data-integration目录里包含了Spoon的启动文件,即spoon.bat,双击该文件就可以启动Spoon,启动界面如图所示。

启动成功以后的界面如图所示

二、使用Kettle实现数据排序

实例,演示如何使用Kettle实现数据排序,具体包括如下步骤:

创建文本文件;

建立转换;

设计转换;

执行转换。

(1)创建文本文件

在“E:\bigdataCol\kettle\”目录下新建一个文本文件score.txt,其内容如图所示,文件的第1行是字段名称,包括name和score,字段之间用分号隔开,其余行都是记录,字段值之间也是用分号隔开。

(2)建立转换

在Spoon主界面的“主对象树”栏目中,在“转换”上面(如图所示)单击鼠标右键,在弹出的菜单中点击“新建”。点击Spoon主界面左上角的“保存”图标,把这个转换保存到某个路径下(E:\bigdataCol\kettle\)并且名称为“sort_data”。

(3)设计转换

在“核心对象”栏目中,在“输入”控件里把“文本文件输入”拖到右侧设计区域,然后在“转换”控件里把“排序记录”拖到右侧设计区域,然后为这两个控件建立连线

双击设计区域的“文本文件输入”控件图标,打开设置界面(如图所示),点击“文件或目录”右侧的“浏览”按钮,添加文件“E:\bigdataCol\kettle\score.txt”,然后,点击“增加”按钮,执行效果如图

在“内容”选项卡中,设置分隔符为分号“;”

在“字段”选项卡中(如图所示),点击“获取字段”按钮,成功获取字段以后的效果如图所示。

点击界面(如图所示)底部的“预览记录”按钮,就可以预览数据(如图所示)。最后,点击界面底部的“确定”按钮,完成“文本文件输入”控件的设置。

双击设计区域的“排序记录”控件图标,打开设置界面(如图所示),在“字段名称”下拉列表中选择“score”,在“升序”下拉列表中选择“是”,然后点击“确定”按钮完成设置。全部设置完成以后,需要保存设计文件。

4.执行转换

相关推荐

鲁大师能不能查cpu风扇
正规beat365app

鲁大师能不能查cpu风扇

📅 07-16 👁️ 8142
做一个水嫩不油腻的完美煎蛋🍳(超详细版)
365bet体育网

做一个水嫩不油腻的完美煎蛋🍳(超详细版)

📅 07-04 👁️ 8495
正在阅读:如何解决微信卡群的问题?解决微信卡群的方法如何解决微信卡群的问题?解决微信卡群的方法