您好,欢迎访问一九零五行业门户网

Hive学习之Hive数据库DDL

hive提供了与sql相的数据定义语言(ddl),对于熟悉sql的人来说,学习hive的ddl是非常容易得,即使从未接触过sql的人,学习也不是一件很难的事情。虽然本人对sql有一定的了解,但绝不敢自称熟悉sql,所以准备对hiveql进行深入的学习,按照sql通常的学习曲线,
    hive提供了与sql相似的数据定义语言(ddl),对于熟悉sql的人来说,学习hive的ddl是非常容易得,即使从未接触过sql的人,学习也不是一件很难的事情。虽然本人对sql有一定的了解,但绝不敢自称熟悉sql,所以准备对hiveql进行深入的学习,按照sql通常的学习曲线,先学习ddl,再学习dml(数据操作语言)。由于需要演示一些语句的示例,不得不超前使用一些其它语句,比如show、describe等。
create/drop/alter数据库    创建数据库的语法如下:
create(database|schema) [if not exists] database_name[commentdatabase_comment][locationhdfs_path][withdbproperties (property_name=property_value, ...)];
在创建数据库时可以指定数据库在hdfs上的存储位置以及数据库的属性,示例如下:
hive> showdatabases;okdefaulttime taken:1.842 seconds, fetched: 1 row(s)hive> createdatabase learning comment 'learning hive database' withdbproperties('creator'='hadoop','date'='2014-06-04', 'test'='first database');oktime taken:5.274 secondshive> showdatabases;okdefaultlearningtime taken:0.022 seconds, fetched: 2 row(s)hive>describe database learning;oklearning learning hive database hdfs://hadoop:9000/user/hive/warehouse/learning.db hadooptime taken:0.078 seconds, fetched: 1 row(s)
从例子的演示来看,默认情况下新建的数据库存储在/user/hive/warehouse,该值可由hive.metastore.warehouse.dir参数指定,默认即为上述目录,数据库的拥有者为hadoop用户,可以使用下面即将介绍的alter语句修改数据库的拥有者为hive:
hive> alterdatabase learning set owner user hive;oktime taken:0.255 secondshive>describe database learning;oklearning learning hive database hdfs://hadoop:9000/user/hive/warehouse/learning.db hivetime taken:0.015 seconds, fetched: 1 row(s)
drop数据库的语法如下:
drop (database|schema) [if exists] database_name [restrict|cascade];
hive> drop database learning;oktime taken: 0.933 secondshive> show databases;okdefaulttime taken: 0.037 seconds, fetched: 1 row(s)hive> dfs -lsr /user/hive/warehouse;drwxr-xr-x - hadoopsupergroup 0 2014-05-23 16:43/user/hive/warehouse/page_viewdrwxr-xr-x - hadoopsupergroup 0 2014-05-14 11:29/user/hive/warehouse/pokes
从上面的输出结果可以看出,在数据库中不存在表的情况下可以直接删除数据库,那么如果数据库存在表结果会是如何呢?下面的例子演示了这种情况:
hive> use learning;oktime taken: 0.105 seconds hive> create table how(name string);oktime taken: 0.982 secondshive> dfs -lsr /user/hive/warehouse;drwxr-xr-x - hadoopsupergroup 0 2014-06-04 11:11/user/hive/warehouse/learning.dbdrwxr-xr-x - hadoopsupergroup 0 2014-06-04 11:11/user/hive/warehouse/learning.db/howdrwxr-xr-x - hadoopsupergroup 0 2014-05-23 16:43/user/hive/warehouse/page_viewdrwxr-xr-x - hadoopsupergroup 0 2014-05-14 11:29/user/hive/warehouse/pokeshive> drop database learning;failed: execution error, return code 1 fromorg.apache.hadoop.hive.ql.exec.ddltask.invalidoperationexception(message:database learning is not empty. one or moretables exist.)hive> drop database learning restrict;failed: execution error, return code 1 fromorg.apache.hadoop.hive.ql.exec.ddltask.invalidoperationexception(message:database learning is not empty. one or moretables exist.)hive> drop database learning cascade;oktime taken: 3.151 secondshive> show databases;okdefaulttime taken: 0.019 seconds, fetched: 1 row(s)hive> dfs -lsr /user/hive/warehouse;drwxr-xr-x - hadoopsupergroup 0 2014-05-23 16:43/user/hive/warehouse/page_viewdrwxr-xr-x - hadoopsupergroup 0 2014-05-14 11:29/user/hive/warehouse/pokes
当数据库中存在表时无法直接删除,会提示数据库非空,存在表,这时可以使用cascade关键字,使用restrict关键字与默认行为等价。
    alter数据库的语法如下:
alter databasedatabase_name set dbproperties (property_name=property_value, ...);alter databasedatabase_name set owner [user|role] user_or_role;
其它类似信息

推荐信息