기술_Kudu 23

다중 마스터 배포의 죽은 마스터에서 복구

Kudu 다중 마스터 배포는 마스터가 손실 된 경우 정상적으로 작동합니다. 그러나 죽은 마스터를 교체하는 것이 중요합니다. 그렇지 않으면 사용 가능한 마스터 수에 따라 두 번째 오류로 인해 가용성이 손실 될 수 있습니다. 이 워크 플로는 데드 마스터를 교체하는 방법을 설명합니다. KUDU-1620 으로 인해 라이브 마스터를 다시 시작하지 않고는이 워크 플로를 수행 할 수 없습니다. 따라서 워크 플로에는 유지 관리 기간이 필요하지만 클러스터가 DNS 별칭으로 설정된 경우 잠재적으로 짧은 기간입니다. 회복 준비 DNS 별칭없이 배포가 구성된 경우 다음 단계를 수행하십시오. 유지 관리 기간을 설정합니다 (1 시간이면 충분 함). 이 기간 동안 Kudu 클러스터를 사용할 수 없습니다. 클러스터의 모든 Kudu ..

기술_Kudu 2022.07.07

전체 노드의 물리적 백업

Kudu는 아직 내장 된 물리적 백업 및 복원 기능을 제공하지 않습니다. 그러나 Kudu 노드 (태블릿 서버 또는 마스터)의 물리적 백업을 생성하고 나중에 복원 할 수 있습니다. 클러스터의 모든 Kudu 프로세스를 중지하십시오. 이렇게하면 백업 된 노드의 태블릿이 불필요하게 다른 곳에 복제되는 것을 방지 할 수 있습니다. 백업을 만드는 경우 백업 할 각 노드에서 WAL, 메타 데이터 및 데이터 디렉터리의 복사본을 만듭니다. 이 복사본은 모든 파일 속성과 희소성을 유지하는 것이 중요합니다. 백업에서 복원하는 경우 기존 WAL, 메타 데이터 및 데이터 디렉터리를 삭제 한 다음 이동 또는 복사를 통해 백업을 복원합니다. 백업 생성과 마찬가지로 복원시 모든 파일 속성과 희소성을 유지하는 것이 중요합니다. 클러스..

기술_Kudu 2022.07.07

백업 및 복원

논리적 백업 및 복원 Kudu 1.10.0부터 Kudu는 Apache Spark를 사용하여 구현 된 작업을 통해 전체 및 증분 테이블 백업을 모두 지원합니다. 또한 Apache Spark를 사용하여 구현 된 복원 작업을 통해 전체 및 증분 백업에서 테이블 복원을 지원합니다. Kudu 백업 및 복원 작업에서 Apache Spark를 사용하는 경우 Spark 설명서 에 따라 Apache Spark가 환경에 설치되어 있는지 확인 합니다 . 또한 애플리케이션 제출에 대한 Apache Spark 문서를 검토하십시오 . 테이블 백업 하나 이상의 Kudu 테이블을 백업하려면 KuduBackupSpark 작업을 사용할 수 있습니다. 테이블에 대한 작업이 처음 실행되면 전체 백업이 실행됩니다. 추가 실행은 초기 전체 백..

기술_Kudu 2022.07.07

랙 인식

버전 1.9부터 Kudu는 랙 인식 기능을 지원합니다. Kudu의 일반적인 재 복제 방법은 단일 노드 장애시 클러스터의 가용성을 보장합니다. 그러나 클러스터는 여러 노드의 상관 된 오류에 취약 할 수 있습니다. 예를 들어, 랙 상단 형 스위치에 장애가 발생하면 데이터 센터의 동일한 랙에있는 모든 물리적 호스트를 동시에 사용할 수 없게 될 수 있습니다. Kudu의 랙 인식 기능은 데이터 센터의 단일 랙 오류와 같은 일부 종류의 상관 된 오류로부터 보호합니다. Kudu 랙 인식 기능의 첫 번째 요소는 위치 할당입니다. 태블릿 서버 또는 클라이언트가 마스터에 등록하면 마스터가 위치를 할당합니다. 위치는로 /시작하는 구분 된 문자열 /이며 각 구분 된 /구성 요소는 집합의 문자로 구성됩니다 [a-zA-Z0-9_..

기술_Kudu 2022.07.07

Apache Must 관리

웹 인터페이스 보유 Kudu 태블릿 서버 및 마스터는 내장 웹 인터페이스에 유용한 운영 정보를 제공합니다. 웹 마스터 인터페이스가 있어야합니다. Kudu 마스터 프로세스는 포트 8051에서 웹 인터페이스를 제공합니다. 인터페이스는 클러스터 상태에 대한 정보가있는 여러 페이지를 표시합니다. 태블릿 서버 목록, 호스트 이름 및 마지막 하트 비트 시간. 각각에 대한 스키마 및 태블릿 위치 정보를 포함한 테이블 목록입니다. Impala Shell에 붙여 넣어 기존 테이블을 Impala의 알려진 데이터 소스 목록에 추가 할 수있는 SQL 코드입니다. 태블릿 서버 웹 인터페이스 필요 각 태블릿 서버는 포트 8050에서 웹 인터페이스를 제공합니다. 인터페이스는 서버에서 호스팅되는 각 태블릿에 대한 정보, 현재 상태 ..

기술_Kudu 2022.07.07

테이블 삭제

테이블이를 사용하여 Impala에서 내부 테이블로 생성 된 경우 CREATE TABLE표준 DROP TABLE구문은 기본 Kudu 테이블과 모든 데이터를 삭제합니다. 을 사용하여 테이블이 외부 테이블로 생성 된 경우 CREATE EXTERNAL TABLEImpala와 Kudu 간의 매핑이 삭제되지만 Kudu 테이블은 모든 데이터와 함께 그대로 유지됩니다. DROP TABLE my_first_table; 무엇 향후 계획? 위의 예에서는 Impala Shell로 수행 할 수있는 작업의 일부만 살펴 보았습니다. Impala 프로젝트에 대해 알아보십시오 . Impala 문서를 읽으십시오 . 보기 임팔라 SQL 참조 . Impala 내부에 대해 읽어 보거나 Impala Wiki 에서 Impala에 기여하는 방법을..

기술_Kudu 2022.07.06

테이블에 데이터 삽입

Impala를 사용하면 표준 SQL 구문을 사용하여 Kudu에 데이터를 삽입 할 수 있습니다. 단일 값 삽입 이 예에서는 단일 행을 삽입합니다. INSERT INTO my_first_table VALUES (99, "sarah"); 이 예에서는 단일 문을 사용하여 3 개의 행을 삽입합니다. INSERT INTO my_first_table VALUES (1, "john"), (2, "jane"), (3, "jim"); 대량으로 삽입 대량으로 삽입 할 때 최소한 세 가지 일반적인 선택 사항이 있습니다. 데이터와 상황에 따라 각각 장단점이있을 수 있습니다. 여러 단일 INSERT문 이 접근 방식은 이해하고 구현하기 쉽다는 장점이 있습니다. Impala는 Kudu의 삽입 성능에 비해 쿼리 시작 비용이 높기 때문..

기술_Kudu 2022.07.06

SQL 술어 평가를위한 성능 최적화

경우 WHERE쿼리의 절은 운영자와의 비교를 포함 =, =, BETWEEN또는 IN, 쿠두 직접 상태를 평가하고 만 관련 결과를 반환합니다. Kudu는 관련 결과 만 Impala에 반환하기 때문에 최적의 성능을 제공합니다. 술어 !=, LIKE또는 Impala에서 지원하는 다른 술어 유형의 경우 Kudu는 술어를 직접 평가하지 않지만 모든 결과를 Impala에 반환하고 Impala를 사용하여 나머지 술어를 평가하고 그에 따라 결과를 필터링합니다. 이로 인해 WHERE절 평가 전후의 결과 집합의 델타에 따라 성능 차이가 발생할 수 있습니다 . 테이블 분할 테이블은 기본 키 열의 파티션 스키마에 따라 태블릿으로 분할됩니다. 각 태블릿은 하나 이상의 태블릿 서버에서 제공됩니다. 이상적으로는 테이블을 여러 태블..

기술_Kudu 2022.07.06

기존 테이블 쿼리

HMS 통합을 활성화하지 않으면 Kudu API 또는 Apache Spark와 같은 기타 통합을 통해 생성 된 테이블이 Impala에 자동으로 표시되지 않습니다. 이를 쿼리하려면 먼저 Impala 내에 외부 테이블을 만들어 Kudu 테이블을 Impala 데이터베이스에 매핑해야합니다. CREATE EXTERNAL TABLE my_mapping_table STORED AS KUDU TBLPROPERTIES ( 'kudu.table_name' = 'my_kudu_table' ); Kudu-HMS 통합이 활성화되면 Impala없이 Kudu에서 테이블을 만들 때 HMS에서 내부 테이블 항목이 자동으로 생성됩니다. Impala를 통해 이러한 테이블에 액세스하려면 invalidate metadataImpala가 최신..

기술_Kudu 2022.07.06

Apache Impala와 함께 Apache 사용

개요 Kudu는 Apache Impala와 긴밀하게 통합되어 있으므로 Kudu API 를 사용하여 사용자 지정 Kudu 애플리케이션을 구축 하는 대신 Impala를 사용하여 Impala의 SQL 구문을 사용하여 Kudu 태블릿에서 데이터를 삽입, 쿼리, 업데이트 및 삭제할 수 있습니다 . 또한 JDBC 또는 ODBC를 사용하여 Impala를 브로커로 사용하여 모든 언어, 프레임 워크 또는 비즈니스 인텔리전스 도구로 작성된 기존 또는 새 애플리케이션을 Kudu 데이터에 연결할 수 있습니다. 요구 사항 이 문서는 특정 버전의 Impala에만 해당됩니다. 설명 된 구문은 다음 릴리스에서만 작동합니다. CDH 5.10과 함께 제공되는 Impala 2.7.0 버전입니다. SELECT VERSION()보고 impa..

기술_Kudu 2022.07.06