인공지능
빠르고 효율적인 낮은계수표현 그래프 구축 방법을 아시나요?
가격 협의
준지도학습은 라벨된 데이터와 라벨되지 않은 데이터를 함께 사용하여 높은 예측 성능을 제공하는 기계 학습 방법입니다. 특히 그래프기반 준지도학습은 높은 예측 성능으로 주목받고 있으며, 그래프 구축의 품질이 학습 성능에 큰 영향을 미칩니다. 그러나 기존의 그래프 구축 방법들은 계산 복잡도가 높아 비효율적일 수 있습니다. 이를 해결하기 위해 낮은계수표현(LRR) 기반 방법이 제안되었지만, 계산 효율성에서 여전히 한계가 있습니다. 본 발명에서는 이러한 문제를 해결하기 위해 FastGLRR(FaGLRR)과 FastMLRR(FaMLRR)을 제안합니다. 이 방법들은 기존 LRR 기반 방법보다 훨씬 빠르고 동일한 예측 결과를 제공하여, 얼굴 클러스터링, 객체 검출 등 다양한 기계 학습 응용 분야에서 더 나은 성능을 기대할 수 있습니다.SVD데이터 분석객체 검출준지도학습FastMLRR
인공지능
음성 인식에서 어휘 문제를 해결하는 새로운 방법
가격 협의
현대의 음성 인식 시스템은 정확성과 효율성을 높이기 위해 단어들을 조합하여 임의의 문장을 생성해야 합니다. 기존 방식들은 열외 어휘 문제와 형태소 분석 오류 등으로 인해 한계를 보였습니다. 이를 개선하기 위해 음절 레벨의 세그멘테이션과 언어 모델을 통한 어휘 자동 생성을 제안합니다. 이 자동 어휘 생성 방법은 특히 동아시아 언어의 복잡한 구조에서 큰 효과를 발휘하며, 음성 인식 정확도와 효율성을 크게 향상시킬 수 있습니다. 다양한 음성 인식 시스템에 적용 가능하며, 스마트 디바이스나 자동 번역 시스템 등에서 활용될 수 있습니다.세그멘테이션 오류사용자 경험 개선시장 점유율 확대형태소 분석동아시아 언어
데이터처리 외
한국어 음성 인식 성능 극대화를 위한 대용량 코퍼스 구축 방법
가격 협의
최근 한국어 음성 인식 시스템의 성능을 극대화하기 위해 대용량 코퍼스 구축이 중요한 이슈로 떠오르고 있습니다. 현재 상용 음성 인식 시스템들은 단일 문장 단위로만 제한되며, 특히 한국어에서는 정확도가 낮습니다. 이에 따라 멀티미디어 콘텐츠 제공 서버로부터 영상 데이터와 자동 전사된 스크립트를 수집하고, 이를 정제하여 약하게 라벨링된 코퍼스를 생성하는 방법이 제안되었습니다. 이 기술은 방송, 교육, 상담 등 다양한 분야에서의 실시간 자막 생성, 회의 내용 자동 전사, 자동 통역 서비스에서 큰 효용을 발휘할 것입니다.자연어 처리AI 음성 인식멀티미디어 콘텐츠음성 데이터 추출자동 통역 서비스
인공지능
한국어 서술형 수학 문제 해결을 위한 Graph-to-Tree 신경망 모델
가격 협의
자연어 처리를 위한 연구가 활발히 이루어지고 있지만, 여전히 인간과 유사한 수준의 텍스트 분석과 문제 해결 능력을 갖춘 AI는 제한적입니다. 특히, 한국어 서술형 수학 문제를 효과적으로 해결하기 위한 기술은 부족합니다. 이를 해결하기 위해 Graph-to-Tree 신경망 모델이 제안되었으며, 이 모델은 한국어 수학 문제를 전처리하고 형태소 단위로 토큰화한 후, QuantityCell을 구축하고 이를 기반으로 QuantityCellGraph와 QuantityComparisonGraph를 생성합니다. 그래프 인코더 모듈을 통해 문제를 해결하는 이 모델은 교육 현장에서 효과적인 문제 풀이 도구로 활용될 수 있으며, 문제 해결 정확도가 높아 교육적 신뢰성을 더욱 높일 수 있습니다.자연어 처리QuantityCell형태소 분석교육용 소프트웨어AI 학습 도구
인공지능 외
사용자 지정 문장 개수로 요약하는 문서자동요약시스템!
가격 협의
최근 다양한 텍스트 문서 형태에 맞춰 중요한 정보를 요약하는 문서자동요약기술이 주목받고 있습니다. 기존의 요약 시스템들은 주로 순환신경망 모델을 사용하여 단순한 요약문을 생성하지만, 문장 개수를 조절하기 어렵다는 문제가 있었습니다. 본 기술은 이를 해결하기 위해 짧은 요약문 생성 모델과 긴 요약문 생성 모델을 통해 사용자가 원하는 문장 개수로 정확하게 요약문을 생성할 수 있습니다. AIHub 신문기사 데이터를 이용한 실험 결과에 따르면, 짧은 요약문 생성 모델이 높은 정확도를 기록했습니다. 다양한 도메인에서 활용 가능하며, 시간과 비용을 절감할 수 있는 맞춤형 요약 서비스를 제공합니다.머신러닝자연어 처리자동화 시스템신문기사 요약문서자동요약기술
분산원장
한국어 자연어처리를 위한 통합 토크나이저의 필요성과 구현 방법
가격 협의
자연어처리(NLP)에서 한국어의 효율적인 토큰화는 매우 중요합니다. 한국어는 명사와 조사가 결합된 교착어의 특성을 가지고 있어 토큰화가 도전적입니다. 이를 해결하기 위해 음성 인식과 언어 이해 과정을 통합하는 통합 토크나이저가 필요합니다. 이 기술은 서브워드 토큰화를 사용하여 한국어의 특성을 반영하며, 단일 토크나이저를 통해 시스템 전반의 효율성과 처리 속도를 높일 수 있습니다. 이러한 통합 시스템은 음성 비서, 통번역 시스템, 스마트 홈 등 다양한 응용 프로그램에 효과적으로 활용될 수 있으며, 특히 실시간 성능 향상과 비용 절감이라는 기대효과를 제공합니다.한국어 자연어처리서브워드 토큰화교육용 어플리케이션처리 속도 향상언어 이해
인공지능
복잡한 질문에도 정확히 답하는 자연어 질의응답 기술
가격 협의
자연어 질의응답기술은 모바일 기기에서 입력 한계를 극복하기 위해 개발되었습니다. 기존 엔드투엔드 메모리 네트워크 기술은 간단한 질문에선 탁월한 성능을 보였으나, 복잡한 문맥에서는 성능이 저하되었습니다. 특히, 숫자나 고유명사 처리에 어려움을 겪었습니다. 새로운 기술은 단어 자질을 강화하여 복잡한 질문에도 적절히 대응하며, 고객 서비스 챗봇, 음성 비서 등 다양한 응용 분야에서 활용 가능합니다. 이를 통해 사용자 경험을 향상시키고 운영 비용을 절감할 수 있습니다.자동화된 응답모바일 기기복잡한 문맥 이해문장 임베딩서비스 효율성
분산원장 외
블록체인 지리 데이터 검색의 새로운 해법은?
가격 협의
블록체인 기술이 다양한 응용 분야에 접목되면서 블록체인 기반의 공간 정보 서비스가 주목받고 있습니다. 그러나 현재 블록체인에 저장된 지리 공간 데이터의 검색 및 분석 기법에 대한 연구는 충분하지 않은 상황입니다. 본 발명은 블록체인의 쓰기-집중적인 환경에서 지리 공간 데이터를 효율적으로 인덱싱할 수 있는 새로운 기법을 제안합니다. 이를 통해 데이터 삽입 시 I/O 비용을 감소시키고, 데이터 검색 및 분석의 효율성을 높일 수 있습니다. 이 기술은 배송 추적 시스템, 자율 주행차 데이터 전달 시스템 및 도시 에너지 관리와 같은 블록체인 기반의 다양한 위치 정보 서비스에 적용될 수 있습니다.데이터 인덱싱분산 시스템도시 에너지 관리자율 주행차위치 정보 서비스
분산원장 외
블록체인에서 지리공간 데이터를 효율적으로 처리하는 방법은?
가격 협의
최근 블록체인 기술이 다양한 응용 분야에서 주목받고 있습니다. 예를 들어, 식품 유통, 토지 거래, IoT, 헬스케어 등 여러 분야에서 사용되고 있습니다. 그러나 블록체인 환경에서 지리공간 데이터를 효과적으로 처리하는 방법은 아직 부족합니다. 기존의 공간 데이터베이스와 달리, 블록체인은 주기적인 대량 업데이트와 데이터 불변성으로 인해 어려움을 겪습니다. 이 문제를 해결하기 위해 새로운 인덱스 구조와 지리공간 데이터 검색 기술이 필요합니다. 본 발명은 LSM 트리 기반의 공간 데이터 인덱싱 기법을 제안하며, 이는 대량 업데이트 시 성능을 향상시킵니다. 특히, 메모리 컴포넌트와 디스크 컴포넌트를 효과적으로 관리하여 저장 공간을 절약하고 검색 속도를 높입니다. 이를 통해 블록체인 기반의 다양한 공간 정보 서비스에 적용 가능하며, 시스템 성능을 크게 향상시킬 수 있습니다.공간 데이터베이스토지 거래식품 유통데이터 불변성대량 업데이트
분산원장
블록체인에서 지리 정보 데이터를 다루기 위한 혁신적 인덱싱 방법
가격 협의
블록체인 시스템에서 지리 정보 데이터를 다루는 방식은 점점 중요성이 커지고 있습니다. 전통적인 방식들, 예를 들어 Ethereum의 FOAM에서 사용하는 Geohash 코드는 검색 성능에 한계가 있으며, R-tree나 Quad-tree 같은 트리형 인덱스는 블록체인 환경에서 비효율적입니다. 이를 해결하기 위해 제안된 새로운 인덱싱 방법은 메모리와 디스크 기반의 하이브리드 구조를 사용하여, 빠르고 효율적인 업데이트와 탐색을 동시에 제공합니다. 이 기술은 제조업, 스마트 시티, 지리 정보 시스템(GIS) 등 다양한 분야에 적용될 수 있으며, 블록체인의 효율성과 데이터 처리 비용 절감에 크게 기여할 것입니다.데이터 인덱싱R-tree스마트 시티Quad-tree디스크 인덱스
분산원장
블록체인 샤딩 네트워크를 위한 최적 메시지 전달 방법
가격 협의
블록체인 샤딩 기법은 네트워크 확장성 문제를 해결하고자 고안되었으나, 기존의 플러딩 방식은 이점 발휘에 제약을 가집니다. 이 기술은 노드 간 XOR 거리를 기반으로 라우팅 테이블을 작성하여 메시지 전달을 최적화합니다. 중개 노드 없이 직접 메시지를 전달함으로써 트래픽을 최소화하고, 효율성 및 보안성을 높입니다. 이 방법을 통해 전체 시스템의 성능을 크게 향상시킬 수 있습니다.보안성라우팅 테이블네트워크 트래픽메시지 전달네트워크 성능
분산원장
샤딩 기술로 이더리움의 트랜잭션 한계를 극복할 수 있을까?
가격 협의
블록체인은 비트코인에서 처음 등장한 기술로, 제3자의 개입 없이 무결성과 신뢰성을 확보할 수 있는 분산 원장 기술입니다. 이더리움은 이러한 블록체인 기술을 응용하여 분산 응용 프로그램을 지원하고, 다양한 상태를 표현할 수 있는 상태 기반 블록체인입니다. 그러나 블록체인의 트랜잭션 양에는 한계가 있어 이를 해결하기 위해 이더리움 샤딩 기술이 제안되었습니다. 샤딩 기술은 네트워크를 여러 개의 샤드로 나누어 병렬적으로 트랜잭션을 처리함으로써 처리량을 증가시키는 방법입니다. 하지만 특정 샤드에 과도한 트랜잭션 로드가 걸릴 경우 성능 저하 문제가 발생할 수 있습니다. 이 문제를 해결하기 위해 트랜잭션의 가스 소모량을 바탕으로 트랜잭션 로드를 균형 있게 분배하는 기술이 개발되었습니다. 이 방법은 트랜잭션 처리 시간을 최소화하고, 네트워크의 성능을 향상시킵니다.무결성네트워크 성능이더리움 가상 머신분산 원장트랜잭션 처리