Hive 数据库仓库的基本操作
查看hive中的数据库
Show databases;
查看hive中的表
Show tables;
查看表结构信息
DESCRIBE table_name;
创建表:
CREATE TABLE daxiong (id INT, name STRING);
创建一个新表daxiong1,结构与daxiong一样
Create table daxiong1 like daxiong;
创建分区表
create table logs(ts bigint,line string) partitioned by (dt String,country String);
加载表数据
(从linux(ext3/ext4文件系统到hive))
a文件之间是空格,b文件之间是tab键;一会看结果。
hive> create table ha(id int,name string)
> row format delimited
> fields terminated by '\\t'
> stored as textfile;
OK
Time taken: 0.28 seconds
注:[ROW FORMAT DELIMITED]关键字,是用来设置创建的表在加载数据的时候,支持的列分隔符。
[STORED AS file_format]关键字是用来设置加载数据的数据类型,默认是TEXTFILE,如果文件数据是纯文本,就是使用 [STORED AS TEXTFILE],然后从本地直接拷贝到HDFS上,hive直接可以识别数据。
从HDFS上导入数据到Hive表
从linux上传到hdfs上:
load data inpath '/user/c' into table ha;
导出到本地文件系统
insert overwrite local directory '/home/hdfs/d' select * from ha;
导出到HDFS中
insert overwrite directory '/user/d select * from ha;
查看:
Hive连接hbase(数据传输)
建立一个表格classes具有1个列族user
create 'classes','user'
查看表的构造
describe 'classes‘
加入数据
put 'classes','001','user:name','jack'put 'classes','001','user:age','20' put 'classes','002','user:name','liza' put 'classes','002','user:age','18'
查看classes中的数据
scan 'classes'
创建外部hive表,查询验证:
create external table classes(id int, name string, age int) STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,user:name,user:age") TBLPROPERTIES("hbase.table.name" = "classes");
select * from classes;
再添加数据到Hbase
put 'classes','003','user:age','1820183291839132'
scan 'classes'
Hive查询,看看新数据
select * from classes;
null,因为3没有name,所以补位Null,而age为Null是因为超过最大值,截图中有验证
上述演示了在hbase中添加数据,在hive中就会产生新的数据,下面是在hive中创建hbase连接表,在hbase中就会自动生成一个与hive中同名的表,hive中表的数据发生变化,在hbse中也会发生同样的变化。