侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

建立hive表的数据仓库

数据库  /  管理员 发布于 2年前   133

1.建立hive表:

create external table card_apply(
action_id string,
action_name string,
phone_number string,
city string,
has_creditcard int,
credit_cards string,
has_login int,
server_time string
)PARTITIONED BY(pt STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '|'
STORED AS TEXTFILE;


2.每天从hdfs加载数据:

ALTER TABLE cardApply ADD PARTITION (pt='17-11-20')
LOCATION '/log_data/m_station/pure_log/card_apply_data/17-11-20';


3.验证加载数据是否成功:

select * from card_apply where pt='17-11-20' limit 100;


4.shell脚本load_tracklogs.sh编写:

#!/bin/sh

## 环境变量生效
. /etc/profile

## HIVE HOME
HIVE_HOME=/opt/cloudera/parcels/CDH-5.12.1-1.cdh5.12.1.p0.3/lib/hive/

## 日志目录
LOG_DIR=/log_data/m_station/pure_log/card_apply_data

## 文件名称, 依据日期date获取
yesterday=`date -d -1days '+%y%m%d'`
LOAD_FILE=${LOG_DIR}/${yesterday}
echo $LOAD_FILE
${HIVE_HOME}/bin/hive -e "use cardbaobao; LOAD DATA INPATH '${LOAD_FILE}' INTO TABLE card_apply PARTITION(pt = '${yesterday}');"


遇到的问题:

Loading data to table cardbaobao.card_apply partition (pt=17-11-20)
Failed with exception Unable to move source hdfs://nameservice1/log_data/m_station/pure_log/card_apply_data/17-11-20 to destination hdfs://nameservice1/user/hive/warehouse/cardbaobao.db/card_apply/pt=17-11-20/17-11-20
FAILED: 
Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.MoveTask

解决方法:

CDH->HDFS->配置->检查HDFS权限->取消勾选然后保存重启HDFS  

CDH界面会出现隐患告警,警告可忽略


  • 上一条:
    Hive的数据导入MySQL
    下一条:
    thinkphp6框架中实现定时任务功能流程步骤
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • mysql5.7中实现分区表及分区where in查询示例及分区分表对比浅析(0个评论)
    • mysql中sql_mode的各模式浅析(0个评论)
    • 预处理之SQL参数化查询是如何防止SQL注入的浅析(0个评论)
    • 使用Navicat把mysql5.7版本的数据库导入至mysql8.1版本中流程步骤(0个评论)
    • 在mysql中设置表字段中COLLATE、CHARSET详解(0个评论)
    • 近期文章
    • 在go语言中使用GoPDF包把html生成PDF文件示例(0个评论)
    • 在go语言中创建和解析(读取)符号链接示例(0个评论)
    • ubuntu 22.04系统中报错:Python 3.6 is no longer supported by the Python core team...解决方式(0个评论)
    • Laravel 10.4版本发布(0个评论)
    • mysql5.7中实现分区表及分区where in查询示例及分区分表对比浅析(0个评论)
    • nginx + vue配置实现同域名下不同路径访问不同项目(0个评论)
    • 在laravel框架中的5个HTTP客户端技巧分享(0个评论)
    • 在go语言中使用FFmpeg库实现PCM音频文件编码为mp3格式文件流程步骤(0个评论)
    • gopacket免安装Pcap实现驱动层流量抓包流程步骤(0个评论)
    • 在laravel项目中实现密码强度验证功能推荐扩展包:password-strength(0个评论)
    • 近期评论
    • 博主 在

      2023年国务院办公厅春节放假通知:1月21日起休7天中评论 @ xiaoB 你只管努力,剩下的叫给天意;天若有情天亦老,..
    • xiaoB 在

      2023年国务院办公厅春节放假通知:1月21日起休7天中评论 会不会春节放假后又阳一次?..
    • BUG4 在

      你翻墙过吗?国内使用vpn翻墙可能会被网警抓,你需了解的事中评论 不是吧?..
    • 博主 在

      go语言+beego框架中获取get,post请求的所有参数中评论 @ t1  直接在router.go文件中配就ok..
    • Jade 在

      如何在MySQL查询中获得当月记录中评论 Dear zongscan.com team, We can skyroc..
    • 2017-06
    • 2017-08
    • 2017-09
    • 2017-10
    • 2017-11
    • 2018-01
    • 2018-05
    • 2018-10
    • 2018-11
    • 2020-02
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2020-07
    • 2020-08
    • 2020-09
    • 2021-02
    • 2021-04
    • 2021-07
    • 2021-08
    • 2021-11
    • 2021-12
    • 2022-02
    • 2022-03
    • 2022-05
    • 2022-06
    • 2022-07
    • 2022-08
    • 2022-09
    • 2022-10
    • 2022-11
    • 2022-12
    • 2023-01
    • 2023-03
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客