Comment exécuter des scripts Hive?

Ceci est un didacticiel sur la façon d'exécuter des scripts Hive. L'exécution de ce script réduira le temps et les efforts que nous consacrons à l'écriture et à l'exécution de chaque commande manuellement.

En tant que package d'entreposage de données construit sur Hadoop, Apache Hive est de plus en plus utilisé pour l'analyse de données, l'exploration de données et la modélisation prédictive. Les organisations recherchent des professionnels avec une forte emprise . Dans cet article, voyons comment exécuter des scripts Hive. En général, nous utilisons les scripts pour exécuter un ensemble d'instructions à la fois. Les scripts Hive sont utilisés à peu près de la même manière. Cela réduira le temps et les efforts que nous consacrons à l'écriture et à l'exécution de chaque commande manuellement.



tableau comment créer un ensemble

Les scripts Hive sont pris en charge dans les versions Hive 0.10.0 et supérieures. Comme la version Hive 0.90 est installée dans CDH3, nous ne pouvons pas exécuter de scripts Hive dans CDH3. Vous pouvez essayer les étapes ci-dessous dans CDH4 car la version Hive 0.10.0 est installée. Savez-vous comment créer un script Hive? Si non, cliquez sur pour obtenir plus de précisions.



Master-Hive-Now

Voyons maintenant comment écrire les scripts dans Hive et les exécuter dans CDH4:



Étape 1: Rédaction d'un script Hive.

Pour écrire le script Hive, le fichier doit être enregistré avec l'extension .sql. Ouvrez un terminal dans votre distribution Cloudera CDH4 et donnez la commande suivante pour créer un script Hive.
Commander: sudo gedit sample.sql

Lors de l'exécution de la commande ci-dessus, il ouvrira le fichier avec la liste de toutes les commandes Hive qui doivent être exécutées.



Dans ce script, une table sera créée, décrite et les données seront chargées et extraites de la table.

1. Création de la table dans Hive:

Commander: create table product (productid: int, productname: string, price: float, category: string) rows format des champs délimités terminés par ','

Ici, product est le nom de la table et {productid, productname, price, category} sont les colonnes de cette table.

Les champs terminés par «,» indiquent que les colonnes du fichier d’entrée sont séparées par le symbole «,».

Par défaut, les enregistrements du fichier d'entrée sont séparés par une nouvelle ligne.

2. Description du tableau:

Commander: décrire le produit

3. Chargement des données dans le tableau.

Pour charger les données dans la table, nous devons d'abord créer un fichier d'entrée contenant les enregistrements à insérer dans la table.

comment convertir un double en un int en java

Créons un fichier d'entrée.

Commander: sudo gedit input.txt

Modifiez le contenu du fichier comme indiqué sur la figure.

4. Récupération des données:

Pour récupérer les données, la commande select est utilisée.

Commander: Sélectionnez * du produit

La commande ci-dessus permet de récupérer la valeur de toutes les colonnes présentes dans le tableau. Le script doit être comme il est montré dans l'image ci-dessous.

Maintenant, nous en avons terminé avec l'écriture du script Hive. Le fichier sample.sql peut maintenant être enregistré.

Étape 2: exécution du script Hive

Voici la commande pour exécuter le script Hive:

Commander: ruche –f /home/cloudera/sample.sql

comment élever un nombre à une puissance en java

Lors de l'exécution du script, assurez-vous que le chemin complet de l'emplacement du fichier de script est présent.

Nous pouvons voir que toutes les commandes sont exécutées avec succès.

C'est ainsi que les scripts Hive sont exécutés et exécutés dans CDH4.

Hive est un composant essentiel de Hadoop et votre expertise dans Hive peut vous décrocher des emplois Hadoop les mieux rémunérés! Edureka propose un cours Hadoop spécialement organisé qui vous aide à maîtriser des concepts tels que MapReduce, Yarn, Pig, Hive, HBase, Oozie, Flume et Sqoop. Cliquez sur le bouton ci-dessous pour commencer.

Vous avez une question pour nous? Veuillez les mentionner dans la section commentaires et nous vous recontacterons.

Articles Similaires:

Commandes Hive

Modèles de données Hive