기술_Nifi

술어

구일칠구 2022. 7. 10. 13:44

DataFlow Manager : DataFlow Manager (DFM)는 NiFi 데이터 흐름의 구성 요소를 추가, 제거 및 수정할 수있는 권한이있는 NiFi 사용자입니다.

FlowFile : FlowFile은 NiFi의 단일 데이터를 나타냅니다. FlowFile은 FlowFile 속성과 FlowFile 콘텐츠의 두 가지 구성 요소로 구성됩니다. 콘텐츠는 FlowFile이 나타내는 데이터입니다. 속성은 데이터에 대한 정보 또는 컨텍스트를 제공하는 특성입니다. 키-값 쌍으로 구성됩니다. 모든 FlowFile에는 다음과 같은 표준 속성이 있습니다.

  • uuid : FlowFile을 시스템의 다른 FlowFile과 구별하는 범용 고유 식별자입니다.
  • filename : 디스크 또는 외부 서비스에 데이터를 저장할 때 사용할 수있는 사람이 읽을 수있는 파일 이름
  • path : 데이터가 단일 디렉토리에 저장되지 않도록 데이터를 디스크 또는 외부 서비스에 저장할 때 사용할 수있는 계층 구조화 된 값

프로세서 : 프로세서는 들어오는 데이터를 수신하는 데 사용되는 NiFi 구성 요소입니다. 외부 소스에서 데이터를 가져옵니다. 데이터를 외부 소스에 게시합니다. FlowFiles에서 정보를 라우팅, 변환 또는 추출합니다.

관계 : 각 프로세서에는 0 개 이상의 관계가 정의되어 있습니다. 이러한 관계는 FlowFile 처리 결과를 나타 내기 위해 이름이 지정됩니다. 프로세서가 FlowFile 처리를 완료하면 FlowFile을 관계 중 하나로 라우팅 (또는 "전송")합니다. 그러면 DFM은 각 잠재적 처리 결과에서 FlowFile이 다음으로 이동해야하는 위치를 지정하기 위해 이러한 관계 각각을 다른 구성 요소에 연결할 수 있습니다.

연결 : DFM은 NiFi 도구 모음의 구성 요소 부분에서 캔버스로 구성 요소를 끌어온 다음 연결을 통해 구성 요소를 함께 연결하여 자동화 된 데이터 흐름을 만듭니다. 각 연결은 하나 이상의 관계로 구성됩니다. 그려진 각 연결에 대해 DFM은 연결에 사용할 관계를 결정할 수 있습니다. 이를 통해 데이터가 처리 결과에 따라 다른 방식으로 라우팅 될 수 있습니다. 각 연결에는 FlowFile 대기열이 있습니다. FlowFile이 특정 관계로 전송되면 연결된 Connection에 속한 큐에 추가됩니다.

컨트롤러 서비스 : 컨트롤러 서비스는 사용자 인터페이스에서 DFM에 의해 추가 및 구성된 후 NiFi가 시작될 때 시작되고 다른 구성 요소 (예 : 프로세서 또는 기타 컨트롤러 서비스)에서 사용할 정보를 제공하는 확장 지점입니다. 여러 구성 요소에서 사용하는 일반적인 컨트롤러 서비스는 StandardSSLContextService입니다. 키 저장소 및 / 또는 신뢰 저장소 속성을 한 번 구성하고 애플리케이션 전체에서 해당 구성을 재사용하는 기능을 제공합니다. 이 정보를 필요로 할 수있는 모든 프로세서에서 구성하는 대신 컨트롤러 서비스가 필요에 따라 사용할 수 있도록 모든 프로세서에 정보를 제공한다는 아이디어입니다.

보고 작업 :보고 작업은 백그라운드에서 실행되어 NiFi 인스턴스에서 일어나는 일에 대한 통계 보고서를 제공합니다. DFM은 원하는대로 사용자 인터페이스에서보고 작업을 추가하고 구성합니다. 일반적인보고 작업에는 ControllerStatusReportingTask, MonitorDiskUsage보고 작업, MonitorMemory보고 작업 및 StandardGangliaReporter가 포함됩니다.

깔때기 : 깔때기는 여러 연결의 데이터를 단일 연결로 결합하는 데 사용되는 NiFi 구성 요소입니다.

프로세스 그룹 : 데이터 흐름이 복잡해지면 더 높은 추상 수준에서 데이터 흐름에 대해 추론하는 것이 도움이되는 경우가 많습니다. NiFi를 사용하면 프로세서와 같은 여러 구성 요소를 하나의 프로세스 그룹으로 그룹화 할 수 있습니다. 그런 다음 NiFi 사용자 인터페이스를 사용하면 DFM이 여러 프로세스 그룹을 논리적 데이터 흐름으로 쉽게 연결할 수있을뿐만 아니라 DFM이 프로세스 그룹 내의 구성 요소를보고 조작하기 위해 프로세스 그룹에 들어갈 수 있습니다.

포트 : 하나 이상의 프로세스 그룹을 사용하여 구성된 데이터 흐름에는 프로세스 그룹을 다른 데이터 흐름 구성 요소에 연결하는 방법이 필요합니다. 이것은 포트를 사용하여 이루어집니다. DFM은 임의의 수의 입력 포트 및 출력 포트를 프로세스 그룹에 추가하고 이러한 포트의 이름을 적절하게 지정할 수 있습니다.

원격 프로세스 그룹 : 데이터가 프로세스 그룹 으로 들어오고 나가는 것처럼, 때때로 NiFi의 한 인스턴스에서 다른 인스턴스로 데이터를 전송해야합니다. NiFi는 한 시스템에서 다른 시스템으로 데이터를 전송하기위한 다양한 메커니즘을 제공하지만, 데이터를 다른 NiFi 인스턴스로 전송할 때 원격 프로세스 그룹이이를 수행하는 가장 쉬운 방법 인 경우가 많습니다.

게시판 : NiFi 사용자 인터페이스는 애플리케이션의 현재 상태에 대한 상당한 양의 모니터링 및 피드백을 제공합니다. 롤링 통계와 각 구성 요소에 대해 제공되는 현재 상태 외에도 구성 요소는 게시판을보고 할 수 있습니다. 구성 요소가 게시판을보고 할 때마다 해당 구성 요소에 게시판 아이콘이 표시됩니다. 시스템 수준 게시판은 페이지 상단 근처의 상태 표시 줄에 표시됩니다. 마우스를 해당 아이콘 위로 가져 가면 게시판의 시간과 심각도 (디버그, 정보, 경고, 오류) 및 게시판의 메시지를 보여주는 도구 설명이 제공됩니다. 모든 구성 요소의 게시판은 글로벌 메뉴에서 사용할 수있는 게시판 페이지에서도보고 필터링 할 수 있습니다.

템플릿 : 종종 데이터 흐름은 재사용 할 수있는 여러 하위 흐름으로 구성됩니다. NiFi를 통해 DFM은 데이터 흐름의 일부 (또는 전체 데이터 흐름)를 선택하고 템플릿을 만들 수 있습니다. 이 템플릿에는 이름이 지정된 다음 다른 구성 요소와 마찬가지로 캔버스로 드래그 할 수 있습니다. 결과적으로 여러 구성 요소를 함께 결합하여 데이터 흐름을 만드는 더 큰 구성 요소를 만들 수 있습니다. 이러한 템플릿은 XML로 내보내고 다른 NiFi 인스턴스로 가져올 수도 있으므로 이러한 빌딩 블록을 공유 할 수 있습니다.

flow.xml.gz : 모든 인터페이스 캔버스가 기록되는 NiFi 사용자 상 DFM 둔다는 실시간으로, 하나 개의 파일로 호출 flow.xml.gz . 이 파일은 nifi/conf기본적으로 디렉토리에 있습니다. 캔버스에서 변경 한 내용은 사용자가 "저장"버튼을 클릭 할 필요없이 자동으로이 파일에 저장됩니다. 또한 NiFi는 업데이트 될 때 아카이브 디렉토리에이 파일의 백업 사본을 자동으로 생성합니다. 이러한 아카이브 된 파일을 사용하여 흐름 구성을 롤백 할 수 있습니다. 이렇게하려면 NiFi를 중지하고 flow.xml.gz 를 원하는 백업 복사본으로 바꾼 다음 NiFi를 다시 시작합니다. 클러스터 환경에서 전체 NiFi 클러스터를 중지하고 노드 중 하나의 flow.xml.gz 바꾼 다음 노드를 다시 시작합니다. flow.xml.gz 제거다른 노드에서. 노드가 단일 노드 클러스터로 시작되는 것을 확인했으면 다른 노드를 시작합니다. 교체 된 흐름 구성은 클러스터 전체에서 동기화됩니다. flow.xml.gz 의 이름과 위치 , 자동 아카이브 동작을 구성 할 수 있습니다. 자세한 내용은 시스템 관리자 설명서 를 참조하십시오.