当前位置: 首页 > news >正文

威海网络公司/时空seo助手

威海网络公司,时空seo助手,外包公司简介,安徽六安瓜片是什么茶datax可以理解为sqoop的优化版, 速度比sqoop快 因为sqoop底层是map任务,而datax底层是基于内存 DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定…

datax可以理解为sqoop的优化版,

速度比sqoop

因为sqoop底层是map任务,而datax底层是基于内存

DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能

datax 是让你编写 json

flume 是让你编写 conf

azkaban 是让你编写 flow

sqoop 是让你写命令

将mysql中的数据导入到hdfs上

{"job": {"setting": {"speed": {"channel": 1}},"content": [{"reader": {"name": "mysqlreader","parameter": {"username": "root","password": "123456","connection": [{"querySql": ["select empno,ename,job,hiredate,sal from emp;"],"jdbcUrl": ["jdbc:mysql://bigdata01:3306/sqoop"]}]}},"writer": {"name": "hdfswriter","parameter": {"defaultFS": "hdfs://bigdata01:9820","path": "/datax/emp","fileName": "emp","column": [{"name": "empno", "type": "int"},{"name": "ename", "type": "string"},{"name": "job", "type": "string"},{"name": "hiredate", "type": "string"},{"name": "sal", "type": "double"}],"fileType": "text","writeMode": "append","fieldDelimiter": "\t"}}}]}
}

将hdfs上的数据导入到mysql中

{"job": {"setting": {"speed": {"channel": 1}},"content": [{"reader": {"name": "hdfsreader","parameter": {"path": "/datax/emp/*","defaultFS": "hdfs://bigdata01:9820","column":[ {"index": 0, "type": "string"},{"index": 1, "type": "string"},{"index": 2, "type": "string"},{"index": 3, "type": "string"},{"index": 4, "type": "string"}],"fileType": "text","encoding": "UTF-8","fieldDelimiter": "\t"}},"writer": {"name": "mysqlwriter","parameter": {"writeMode": "replace","username": "root","password": "123456","column": ["empno", "ename", "job", "hiredate", "sal"],"connection": [{"jdbcUrl": "jdbc:mysql://bigdata01:3306/sqoop","table": ["eemmpp"]}]}}}]}
}

使用注意

注意点:

1)指定字段的类型时,datax中的类型只有下面几种,而不是像java一样的

2)默认的分隔符,即 "fieldDelimiter": "xxx" 不指定或者不写的时候,默认为 ' , ' 分割

3)

将mysql 中的数据导入hive(重要)*

说是把mysql中的数据导入hive,其实本质还是将mysql中的数据导入hdfs中

首先先创建一个hive表 指定到hdfs的路径上,再将mysql中的数据导入到这个路径即可

1)首先先创建一个hive表
 

reate external table if not exists ods_01_base_area ( id int COMMENT 'id标识', area_code string COMMENT '省份编码', province_name string COMMENT '省份名称', iso string COMMENT 'ISO编码' )row format delimited fields terminated by ',' stored as TextFile location '/data/nshop/ods/ods_01_base_area/'; -- 指定到hdfs的路径

2)将mysql的数据通过datax导入hdfs

注意指定路径和分隔符 ! 一定要与创建hive表指定的路径一致 且 分隔符也保持一致

{"job": {"setting": {"speed": {"channel": 1}},"content": [{"reader": {"name": "mysqlreader","parameter": {"username": "root","password": "123456","column": ["id","area_code","province_name","iso"],"splitPk": "id","connection": [{"table": ["base_area"],"jdbcUrl": ["jdbc:mysql://bigdata01:3306/datax"]}]}},"writer": {"name": "hdfswriter","parameter": {"defaultFS": "hdfs://bigdata01:9820","path": "/data/nshop/ods/ods_01_base_area/","fileName": "base_area","column": [{"name": "id","type": "int"},{"name": "area_code","type": "string"},{"name": "province_name","type": "string"},{"name": "iso","type": "string"}],"fileType": "text","writeMode": "append","fieldDelimiter": ","}}}]}
}
3) 导入完成,此时hive表中就有了数据

http://www.jinmujx.cn/news/306.html

相关文章:

  • 网站营销单页怎么做/百度seo优化收费标准
  • 交网站建设域名计入什么科目/开鲁网站seo转接
  • 工程造价信息价在什么网站查/博客营销案例
  • 手机网站模板用什么做/草根seo博客
  • 学院网站建设服务招生宣传/爱营销电信版下载app最新版
  • 北京网页设计高端定制/苏州seo服务热线
  • 做网站可以用电脑当服务器吗/百度营销
  • 口碑好的做pc端网站/疫情最新政策最新消息
  • 常州外贸公司网站建设/2023年又封城了
  • 网站开发开源架构/seo网站优化助理
  • 做微商网站制作/北京网络营销策划公司
  • 西安php网站建设/济南疫情最新消息
  • 上海网站建设 建站猫/怎么建个网站
  • 尚义住房和城乡规划建设局网站/友情链接联盟
  • 徐州教育学会网站建设/微信销售平台
  • 深圳建站程序/建站系统软件有哪些
  • 企业网站免费建站/免费招收手游代理
  • 宁德网站建设公司/百度百度一下一下
  • 内蒙古呼和浩特疫情/win10优化大师是官方的吗
  • wordpress网站 添加微信/个人网站规划书模板
  • 试用网站空间/国际实时新闻
  • 东莞网站排名价格/人民政府网站
  • 做机械设备类网站用什么颜色好/网站seo优化外包
  • 南昌简单做网站/我想找一个营销团队
  • 网站程序前台/西安百度竞价托管公司
  • 做网站待遇/什么是企业营销型网站
  • 做网站每页面费用/bing搜索引擎国际版
  • 企业网站建设话术/营销网站
  • wordpress pdf生成/手机端网站优化
  • 工信部外国网站备案/b站在线观看人数在哪