Mit Apache Hive (v.1) verbinden

Diese Version des Apache-Hive-Datenkonnektors wurde aus Analytics 18.x entfernt.
Skripts, die diese Version des Hive-Konnektors verwenden, können nicht in Analytics 18.x ausgeführt werden und müssen aktualisiert werden, um die neue Version des Konnektors zu verwenden.
Diese Version des Konnektors wird in Analytics 17.x und früheren Versionen von Analytics weiterhin funktionieren, solange der Konnektor und die Datenquelle kompatibel bleiben.
Siehe Auf eine neuen ACL-Konnektorversion umstellen

Konzept-Informationen

ACCESSDATA-Befehl

Apache Hive ist ein Cloud-Datendienst. Sie können den Apache-Hive-Datenkonnektor verwenden, um die Hive-Daten Ihrer Organisation zu importieren.

Vorbereitungen

Für eine Verbindung mit Hive müssen Sie die folgenden Informationen einholen:

Benutzername und Kennwort
korrekter Verbindungsport
verwendetes Authentifizierungsschema
Hostname oder IP-Adresse des Servers
Transportmodus für die Kommunikation mit dem Server
Lesezugriff

Hilfe für die Zusammenstellung der Verbindungsvoraussetzungen erhalten Sie vom Hive-Administrator Ihrer Organisation. Falls Ihr Administrator Ihnen nicht weiterhelfen kann, sollten Sie oder Ihr Administrator den Hive-Support kontaktieren.

Hive-Verbindung erstellen

Wählen Sie aus dem Analytics-Hauptmenü Importieren > Datenbank und Anwendung.
Auf der Registerkarte Neue Verbindungen im Abschnitt ACL-Konnektoren wählen Sie Hive.
Tipp
Sie können die Liste verfügbarer Konnektoren filtern, indem Sie in das Feld Verbindungen filtern eine Suchzeichenfolge eingeben. Die Konnektoren sind alphabetisch aufgelistet.
Im Bereich Datenverbindungseinstellungen rufen Sie die Verbindungseinstellungen auf und klicken unten innerhalb des Bereichs auf Speichern und verbinden.
Sie können den standardmäßigen Verbindungsnamen akzeptieren oder einen neuen Namen eingeben.

Die Verbindung für Hive wird in der Registerkarte Bestehende Verbindungen gespeichert. In Zukunft können Sie sich über die gespeicherte Verbindung erneut mit Hive verbinden.

Sobald die Verbindung hergestellt ist, wird das Fenster „Datenzugriff“ im Stagingbereich geöffnet und Sie können den Datenimport beginnen. Hilfe für den Datenimport aus Hive siehe Mit Fenster „Datenzugriff“ arbeiten.

Verbindungseinstellungen

Grundlegende Einstellungen

Einstellung	Beschreibung	Beispiel
Hive-Servertyp	Gibt die Hive-Serverinstanz an, mit der eine Verbindung hergestellt werden soll.	Hive-Server 2
Diensterkennungsmodus	Legt fest, wie die Hive-Serverdienste entdeckt werden. Verfügbare Optionen sind: Keine Diensterkennung – Der Treiber verbindet sich mit Hive ohne einen Ermittlungsdienst. ZooKeeper – Der Treiber entdeckt Hive-Serverdienste durch den ZooKeeper-Dienst.	Keine Diensterkennung
Host(s)	Die IP-Adresse oder der Hostname des Hive-Servers.
Port	Der Port für die Verbindung mit der Hive-Serverinstanz.	10000
Datenbank	Name des zu verwendenden Datenbankschemas, falls in der Abfrage kein Schema explizit angegeben wird.
Zookeeper-Namespace	Der auf ZooKeeper für die Hive-Server-2-znodes konfigurierte Namespace.
Authentifizierungsmechanismus	Gibt den zu verwendenden Authentifizierungsmechanismus an. Verfügbare Optionen sind: Keine Authentifizierung Kerberos Benutzername Benutzername und Kennwort HDInsight-Dienst von Windows Azure	Keine Authentifizierung
Bereich	Der Bereich des Hive-Server-2-Hosts.
Host-FQDN	Vollqualifizierter Domänenname des Hive-Server-Hosts.	_HOST
Service Name	Der Kerberos-Dienstprinzipalname des Hive-Servers.
Benutzername	Benutzername zur Authentifizierung am Hive-Server.
Passwort	Kennwort des Benutzernamens zur Authentifizierung am Hive-Server.
Delegierungs-UID	Benutzer-ID des delegierten Benutzers, an den der Treiber alle Hive-Operationen delegieren muss (statt an den für die Verbindung authentifizierten Benutzer).
Thrift-Transport	Gibt das in der Thrift-Schicht zu verwendende Transportprotokoll an. Verfügbare Optionen sind: Binär SASL HTTP	Binär

Erweiterte Einstellungen

Einstellung	Beschreibung	Beispiel
SSL aktivieren	Legt fest, ob der Client eine SSL-verschlüsselte Verbindung zur Kommunikation mit dem Hive-Server verwendet.
Fehlende Übereinstimmung von allgemeinem Namen und Hostname zulassen	Gibt an, ob ein SSL-Zertifikatsname einer Zertifizierungsstelle dem Hostnamen des Hive-Servers entsprechen muss.
Selbstsigniertes Serverzertifikat erlauben	Spezifiziert, ob der Treiber eine Verbindung zum Hive-Server mit einem selbstsignierten Zertifikat auch dann gestattet, wenn sich das Zertifikat nicht in der Liste vertrauenswürdiger Zertifikate befindet.
Vertrauenswürdige Zertifikate	Der vollständige Pfad der .pem-Datei, die vertrauenswürdige Zertifizierungsstellenzertifikate zur Verifizierung des Servers mit SSL enthält.
Bidirektionales SSL	Legt fest, ob bidirektionales SSL aktiviert ist.
Clientzertifikatsdatei	Der vollständige Pfad der .pem-Datei, die das SSL-Zertifikat des Clients enthält.
Datei für privaten Client-Schlüssel	Der vollständige Pfad der .pem-Datei, die den privaten SSL-Schlüssel des Clients enthält.
Kennwort für privaten Client-Schlüssel	Das Kennwort für die private Schlüsseldatei, die im Feld Datei für privaten Client-Schlüssel festgelegt wurde.
Systemeigene Abfrage verwenden	Gibt an, ob der Treiber systemeigene HiveQL-Abfragen verwendet. Wenn diese Option nicht ausgewählt ist, wandelt der Treiber durch eine Anwendung übermittelte Anfragen in HiveQL in eine äquivalente Form um.
Schnelles SQLPrepare	Gibt an, ob der Treiber die Abfrageausführung an SQLExecute zurückstellt.
Treiberkonfiguration hat Vorrang	Legt fest, ob treiberweite Konfigurationseinstellungen Vorrang vor Verbindungs- und DSN-Einstellungen haben.
Asynchrones Exec verwenden	Spezifiziert, ob Abfragen synchron oder asynchron ausgeführt werden sollen.
Abrufintervall für asynchrones Exec	Die Zeit zwischen jedem Abruf des Status der Abfrageausführung (in Millisekunden).	100
Tabellen mit Abfrage abholen	Gibt an, ob der Treiber die Abfrage SHOW TABLES verwendet, um Tabellennamen aus der Datenbank abzurufen. Bei einer Deaktivierung verwendet der Treiber den Thrift-API-Aufruf „GetTables“.
Unicode-SQL-Zeichentypen	Legt fest, welche SQL-Typen für Zeichenfolgendatentypen zurückgegeben werden. Bei einer Aktivierung gibt der Treiber SQL_WVARCHAR für STRING- und VARCHAR-Spalten sowie SQL_WCHAR für CHAR-Spalten zurück.
Systemtabelle anzeigen	Gibt an, ob der Treiber die Tabelle „hive_system“ für Katalogfunktionsaufrufe wie SQLTables und SQLColumns zurückgibt.
Nur SSPI verwenden	Spezifiziert, ob der Treiber die Kerberos-Authentifizierung mit dem SSPI-Plugin oder mit MIT Kerberos durchführt.
Automatisches Wiederherstellen ungültiger Sitzungen	Legt fest, ob der Treiber automatisch eine neue Sitzung öffnet, sobald die bestehende Sitzung nicht mehr gültig ist.
Abgerufene Zeilen pro Block	Maximale Zeilenanzahl, die eine Abfrage auf einmal zurückgibt.	10000
Standardlänge von Zeichenfolgenspalte	Maximale Zeichenanzahl, die STRING-Spalten enthalten dürfen.	255
Länge binärer Spalte	Maximale Datenlänge für BINARY-Spalten.	32767
Skalierung von Dezimalspalte	Maximale Ziffernanzahl numerischer Datentypen nach dem Dezimalkomma.	10
Socket-Zeitüberschreitung	Anzahl von Sekunden, die eine Operation inaktiv sein kann, bevor sie geschlossen wird.	60
HTTP-Pfad	Die Teil-URL, die dem Hive-Server entspricht.

Hive-Verbindungsfelder

Spalte, eindeutige Namen

Hive Ihre Konnektor-Verbindungen über das Fenster Fenster „Datenzugriff“ verwenden einen Parameter mit einer Verbindungszeichenfolge namens EnableUniqueColumnName, der standardmäßig auf „0“ eingestellt ist. Dieser Parameter muss den Wert „0“ haben, damit sichergestellt ist, dass bei der Verbindung die korrekten Spaltennamen abgerufen werden.

Wenn Sie eine Hive-Verbindung mit DSN statt dem Fenster „Datenzugriff“ erstellen, ist dieser Wert standardmäßig auf „1“ eingestellt. Sie müssen ihn in der Windows-Registrierung auf „0“ ändern, damit Ihre Verbindung funktioniert.

Notiz

Skripts, die DSN-Verbindungen aus älteren ACL-Versionen als 13.1 verwenden, funktionieren nach einer Aktualisierung auf Version 13.1 nicht mehr.