PentahoDataIntegration(Kettle)是Pentaho生态系统中默认的ETL工具。Kettle是一款国外开源的etl工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
通过非常直观的图形化编辑器(Spoon),您可以定义以XML格式储存的流程。在Kettle运行过程中,这些流程会以不同的方法编译。用到的工具包括命令行工具(Pan),小型服务器(Carte),数据库存储库(repository)(Kitchen)或者直接使用IDE(Spoon)。一款国外开源的etl工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
kettle清理数据库连接的方法:
1:清理shared.xml中的不用的数据库连接。(他的保存位置一般在用户主目录下边的.kettle目录中)2:用文本编辑软件打开kjb,ktr文件删除用户到的connection项,保存。
Kettle项目介绍:
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。
Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里,然后以一种指定的格式流出。
Kettle将ELT流程编译为XML格式,学起来十分简单,PentahoDataIntegration(Kettle)使用Java(Swing)开发。Kettle作为编译器对XML格式书写的流程进行编译。这些功能和组件比起Talend在丰富性方面稍逊一些,但是您建立复杂ETL流程需要的一切元素。Kettle的JavaScript引擎(和Java引擎)可以深层地控制对数据的处理。全球数千家机构依赖于Pentaho的,作出更快,更好的业务决策产生积极影响他们的底线。运行Spoon.bat开始软件。需要JRE支持,JRE(JavaRuntimeEnvironment)v6.0Update26安装版:http://www.cr173.com/soft/22134.html
Kettle使用教程:
Kettle自己有三个主要组件:Spoon,Kitchen,Pan。其中Spoon是一个图形化的界面,用于windows的时候,先设置环境变量:pentaho_java_home,例如:C:\ProgramFiles\Java\jdk1.7.0_25,其实就是你的java安装目录,1.6以上即可。windows下双击Spoon.bat就可以了,界面如下:
这里我建立了资源库,其实可以用文件形式存储,存储的结构都是xml,但是我还是觉得建立一个资源库比较好,以后看job等情况也比较简单,因为数据表的可读性比xml要好得多。建立资源库和文件资源库只需要把右上角的小加号点一下,就会出现如下如的界面:
选择第一个就是建立数据库版的资源库,之后:
之后:
测试通过之后点击OK就回到最开始的界面,这时候选择test数据库连接,然后出入你的工程(我是这么叫的)ID和name,这里要记住,因为以后kitchen调度的时候要输入这个参数。
在接下来弹出的框中都点“是”,然后会出现这个界面:
这步会在你的用户下建立很多表,所以最好单独给资源库建立一个用户,当然这是在oracle下,mysql下和DB2下最好也采用同样的方式,把资源库和其他库分开。检查一下:
SQLconnwings/wings@prism已连接。SQLselectcount(1)fromr_repository_log;
COUNT(1)----------0
SQL
表已经建好了。回到最开始的界面,选择test,点击确定,然后就会出现登录对话框,用户密码默认都是admin,以后可以自己改。
接下来就可以开始用这个工具了。
其实对于简单的数据库数据的抽取,基本只需要转换和作业这两种东西。下面就是建立一个转换的步骤:
1点击文件--新建--转换。
2在左侧的树状列表中选“主对象树”,新建DB连接。步骤和上面建资源库一样。一个目标库一个源库。
3在核心对象--输入这个地方拖出一个表输入,在“输出”目录下拖出“表输出”,在“转换”处拖出一个字段选择来,如图:
每一个对象都可以双击修改属性,下面以抽取world数据库的city表为例。
双击表输入,选择数据库连接,选择源数据库,然后点击“获取SQL查询语句”,在弹出的对话框里进行选择即可,之后会变成这样:
下面点击表输出:
点击字段选择:
这样,一个简单的抽取数据的转换就完成了。执行之,点击上面的绿色开始按钮。
我也处在学习中,希望可以把我的经验分享给和我一样的入门者。
下面是补充部分:
在一个Job或者一个trans建立好之后,就可以建立定时任务了。如果是DS,那么DS客户端本身就支持schedule,但是Kettle因为没有服务端和客户端的概念,因此只有使用linux的crontab,其实Job本身也支持定时,但是你必须保证图形界面一直开着,这样并不如crontab那么好。在命令行里使用kettle很简单,Job用kitchen调度,trans用pan调度。
下面是一个kitchen的调度命令:
bash/home/kettle/data-integration/kitchen.sh/repkettle_demo/userusername/passpasswd/levelMinimal/dir/dirname/jobjobname
rep那里写自己的资源库名称。
trans和上面一样,略有不同:
bash/home/kettle/data-integration/pan.sh/repkettle_demo/userusername/passpasswd/levelMinimal/dir/dirname/transtransname
Tags:Kettle,Spoon,ETL工具.
小编点评:桃子播放器破解版是一款非常实用的在线云播软件。桃.
下载小编点评:川财证券独立交易软件软件为独立的委托下单系.
下载小编点评:软件介绍《小兵库房管理系统》是一款十.
下载小编点评:软件介绍快租工程机械是一款提供租赁.
下载小编点评:软件介绍福来来是一个专门为社区生活.
下载小编点评:软件介绍通辽农牧业app是一款为农牧民们.
下载小编点评:软件介绍日历老黄历是一款便民的天气.
下载小编点评:软件介绍飞梭鱼是一款智能的生活服务.
下载小编点评:无双战意传奇手游是深受广大玩家朋友们喜欢的.
下载小编点评:少年游手游是一款武侠类的放置解谜游戏.
下载小编点评:倾城古剑手游是一款超棒的仙侠修仙游.
下载小编点评:梦回盛唐游戏是一款超棒的仙侠游戏。
下载小编点评:脑力测试小游戏是一款测试大脑反应能力.
下载封魔战神破解版下载-封魔战神手游破解版下载v1.1 安卓版
craft笔记编辑器下载-craft笔记编辑器app下载v1.2.0 安卓最新版
飞箭游戏下载-飞箭手机版下载v1.0.1 安卓版
么么哒作战破解版下载-么么哒作战无限金币版下载v1.1 安卓版
旋转飞镖游戏下载-旋转飞镖中文版下载v1.0 安卓版
仙梦奇缘幽游百景手游下载-仙梦奇缘幽游百景官方版下载v1.3.4 安卓版
守护之境最新版下载-守护之境手游下载v1.0.0 安卓版
手游怒斩屠龙当乐版下载-怒斩屠龙当乐版下载v1.4.0 安卓版
幻想召唤者官方手游-幻想召唤者最新手机版(暂未上线)v1.0.4 安卓版
侠影惊鸿手游小米版下载-侠影惊鸿小米游戏下载v1.4.4676 安卓官方正版
包子视频下载免费-包子视频app下载v1.4 安卓最新版本
互传面对面软件安装下载-互传面对面官方版下载v1.0.1 安卓版
溏心风暴爽版无限充下载-溏心风暴bt版下载v1.0.0 安卓变态版