연구자 정보를 불러오는 중입니다...
김지환 교수는 서강대학교 컴퓨터공학과 소속으로, AI 기반 음성인식 및 자연어처리 분야의 선도적인 연구자입니다. 특히 한국어 음성인식 기술 고도화, LLM을 활용한 성능 향상, E2E STT 모델 개발 등에 집중하고 있습니다. 다수의 국책 과제와 산학 협력을 통해 산업계와 학계에 실질적인 기여를 해왔으며, 자동 어휘 생성 및 코퍼스 구축 관련 특허를 보유하고 있습니다. 다양한 논문 발표를 통해 음성 AI 기술 발전에 기여하고 있습니다.

교수
| 소속 | 서강대학교 |
| 부서 학과 | 컴퓨터공학과 |
| 직책 | 교수 |
| 사무실 번호 | 027058924 |
| 이메일 | kimjihwan@sogang.ac.kr |
| 연구자 홈페이지 | |
| 연구실 | 청각지능 연구실 |
| 연구실 홈페이지 |
음성 인식 및 한국어 처리 기술 고도화
본 연구실은 인공지능 기반의 음성 인식 및 자연어 처리 기술을 선도하며, 특히 한국어의 특성을 반영한 기술 고도화에 중점을 두고 있습니다. 종단간(E2E) 음성 인식 시스템의 성능 향상과 대규모 언어 모델(LLM)을 음성 인식에 효과적으로 접목하는 연구를 통해 사용자 경험을 혁신하고 있습니다. 본 연구실은 음성 신호 처리, 딥러닝 기반 음향 모델링, 그리고 언어 모델 최적화 기술을 핵심 역량으로 보유하고 있습니다. 특히, WFST(Weighted Finite-State Transducer) 언어 모델 통합 및 CTC(Connectionist Temporal Classification) 기반 LSTM RNN(Recurrent Neural Network) 모델을 활용하여 복잡한 한국어 음성 데이터를 정교하게 분석하고 인식하는 독자적인 기술을 개발했습니다. 최대 우도에 기반한 자동 어휘 생성 및 코퍼스 구축 서비스 제공 관련 특허를 보유하고 있으며, 이를 통해 한국어 음성 인식 시스템의 정확도와 효율성을 획기적으로 개선하고 있습니다. 이러한 연구는 세종한국어평가(SKA) 자동 출제·채점 연구와 같은 한국어 평가 시스템 개발에 기여하고 있습니다. 또한, 모바일 환경 및 AI 스피커 등 다양한 음성 인터페이스 환경에서의 음성 인식 성능 향상을 목표로 하며, 국내외 학회 및 산업체와의 협력을 통해 기술 상용화 및 사회적 가치 창출에 집중하고 있습니다.
오디오 콘텐츠 이해 및 AI 기반 음향 분석
본 연구실은 음성뿐만 아니라 다양한 오디오 콘텐츠를 심층적으로 이해하고 분석하는 AI 기반 음향 기술 연구를 수행하고 있습니다. 음향 이벤트 분류, 오디오 장면 인식, 음악 데이터 처리 등 광범위한 음향 데이터를 딥러닝 기술로 해석하여 새로운 가치를 창출하는 데 주력하고 있습니다. 본 연구실은 컨볼루션 신경망(CNN), 순환 신경망(RNN) 등 최신 딥러닝 아키텍처를 활용하여 오디오 신호의 특징을 효과적으로 추출하고 분류하는 알고리즘을 개발합니다. 특히, 로그 멜-스펙트로그램 분리를 이용한 오디오 이벤트 분류, 모바일 환경에 최적화된 저복잡도 음향 장면 분류(TP-MobNet) 등의 독창적인 방법론을 통해 이질적인 장치나 불분명한 환경에서의 오디오 분석 강건성을 확보하고 있습니다. 또한, 음성 감정 인식, 음향 간섭 제거 기술 등을 통해 실제 환경에서의 AI 시스템 성능을 높이고 있습니다. 이러한 음향 분석 기술은 무분별적 유해성 미디어 배포 문제 해결을 위한 지능적 분석 및 분류 시스템 개발에 활용될 수 있으며, 오디오 메타데이터 태깅, 스마트 기기 음성 인터페이스의 음향 간섭 제거 등 다양한 응용 분야에서 핵심적인 역할을 수행합니다. 연구실은 기술 이전을 통해 산업 현장의 요구에 부응하며, 실제 문제 해결에 기여하는 실용적인 음향 AI 솔루션을 제공합니다.
대화형 AI 및 인간-컴퓨터 음성 인터페이스
본 연구실은 인간과 컴퓨터 간의 자연스럽고 직관적인 소통을 가능하게 하는 대화형 인공지능(AI) 및 음성 인터페이스 기술 개발에 집중하고 있습니다. 사용자의 의도를 정확히 파악하고 상황에 맞는 적절한 응답을 생성하는 고급 대화 모델 구축을 목표로 합니다. 본 연구실은 화자 간 공유 경험을 활용한 페르소나 인식 장기 음성 대화 모델, 비디오 스토리 이해 기반의 질의응답 시스템, 치매환자 지원을 위한 로봇 대화 인터페이스 등 복합적인 정보를 이해하고 상호작용하는 기술을 연구합니다. 딥러닝 기반의 자연어 이해 및 생성 모델을 활용하여 음성 명령 인식의 정확도를 높이고, 다양한 입출력 환경 변화에도 강건하게 작동하는 음성 대화 인터페이스를 설계합니다. 또한, 사용자의 음성 쿼리를 통한 자기 개선 메커니즘, 발성 장애인을 위한 음성 인터페이스 개발 등 포괄적인 사용자 경험 개선에 기여하고 있습니다. 이러한 대화형 AI 기술은 AI 스피커, 스마트홈 기기, 차량 인포테인먼트 시스템 등 다양한 스마트 환경에서 사용자 편의성을 극대화하는 데 활용됩니다. AI 음성 전문가 과정 개발 컨설팅을 통해 산업체에 최신 기술을 전수하고, 기술 이전 및 산학 협력을 통해 실제 제품 및 서비스에 적용되어 인류의 삶을 더욱 풍요롭게 하는 데 기여하고 있습니다.
ep. 2007 ~ Present : Professor
Dec. 2001 ~ Aug. 2007 : Chief & Senior Research Engineer
[기술 이전 및 기술 지도] - 특허: 최대 우도에 기반한 자동 어휘 생성 (등록번호: 1018464610000) - 특허: 코퍼스 구축 서비스 제공 서버 및 방법 (등록번호: 1026996070000) - 기술지도: AI 음성 전문가 과정 개발 컨설팅 - 기술지도: AI 음성/언어 전문가 과정 개발 컨설팅 [학회 및 위원회 활동] - 2024 한국 HCI 학회 이사 - 2024 한국 음성학회 이사 - 2023 한국 음성학회 부회장 - 2023 한국정보과학회 인공지능 소사이어티 이사 - 2022 한국 음성학회 부회장 - 2022 한국정보과학회 인공지능 소사이어티 이사 - 2021 한국 HCI 학회 이사 - 2021 한국 음성학회 부회장 - 2021 한국정보과학회 인공지능 소사이어티 이사 - 2020 한국 HCI 학회 이사 - 2020 한국 음성학회 이사 - 2019 한국 음성학회 이사 - 2018 한국 음성학회 이사 - 2017 한국 음성학회 이사 - 2016 한국 음성학회 이사 - 2015 한국 음성학회 학술 이사 - 2014 한국 음성학회 학술 이사 - 2013 한국 음성학회 사업 이사 - 2012 한국 음성학회 사업 이사 - 2011 한국 음성학회 사업 이사 - 2009 한국음성학회 총무이사 - 2008 한국음성학회 이사 [수상 내역] - 2021년 20회 한국 HCI 학술대회 최우수 논문상 (공동수상, 제목: “눈으로 보는 오디오: 심층 잔여 네트워크 기반 오디오-텍스트 정합 모델”) - 2018년도 서강대학교 우수강의교수 표창장 - 2016년 국제표준화기구/국제전기기술위원회(ISO/IEC JTC1) 공로상 (Outstanding Contribution Award) - 2016년 2016 한국음성학회 가을학술대회 우수논문상 (공동수상, 제목: “전처리된 음성신호의 잡음 및 울림 제거와 후처리된 음성신호의 노이즈 제거의 특징에 따른 end-to-end 음성인식 결과 비교”) - 2014년 한국음성학회 기술상
Cambridge University Engineering Department 음성인식 (2001) 한국과학기술원(KAIST) 컴퓨터공학과 화자 인식 (1998) 한국과학기술원(KAIST) 컴퓨터공학과 컴퓨터공학 (1996)

보유 기술 로딩 중...
Oct. 2004 ~ Nov. 2004 : Visiting Scholar