비정형 데이터 추출

비정형 데이터 추출

정보의 공유, 활용이 어려운 기존 보관형태의 전자문서 비정형 데이터 추출!
지능형 정부구축, 데이터분석, 인재개발자료, 의료연구, 법률 데이터, 전자문서 통계정보 등
비정형 컨텐츠와 지능형 분석이 결합하여 각종 정보화시스템 구축 활용

1. 각종 고지서 비정형 데이터 정규화

데이터정규화

  • 정형,비정형 전자문서 테이블 자동 탐지
  • 숫자형 데이터의 자동 계산, 합계 검증
  • 비정형 영역의 수식 처리 지능형 알고리즘
  • 명세서, 고지서 등 육안 확인이 필요한 데이터 검증

2. 지능형 이력서 검토 시스템

지능형이력서검토시스템

  • AI "IBM WATSON" 연계하여 대상자 선별 업무의 투명한 결과 도출
  • 지능형 자연어 처리에 의한 데이터 분석 추출
  • 대량의 이력서를 선별하여 인사업무 비용절감

3. 검색엔진 내 문서 검색 및 기간계 시스템 연계

검색엔진기간계시스템연계

  • 자료시스템 등에서 전자문서 파일 포맷 자동 식별
  • 파일내의 텍스트 추출 및 필터링 , 색인 DB생성
  • 추출자료 개인정보 식별 및 패턴 검색 , 개인정보 특수 처리 가공
활용효과
  • 4차산업
  • 비용절감
  • AI
  • 데이터 검증시 패턴, 수식 인식, 분석 알고리즘을 통해 수작업 대체. 비용절감 효과 높음.
  • 방대하게 쌓은 전자문서에서 원하는 내용을 빠르게 검색
  • 검색엔진으로 탐색이 어려운 문서 내 데이터 추출 및 검색 수행
  • 검색엔진과 결합하여 개인정보 필터링, 자동완성, 키워드 사전 생성 등 빠른 검색 업무에 활용
활용제품군

filter

도입사

비정형데이터추출

top