/////

LLM Machine Translation Overgeneration Mitigation with Dynamic Translator Architecture

LLM 기반 기계번역에서 overgeneration 은 단순 오역보다 더 운영상 위험한 실패 모드다. 번역해야 할 원문 범위를 넘어 설명, 주석, 자기 해명, 사실처럼 보이는 추가 정보, 번역 지시문에 대한 응답 을 생성할 수 있기 때문이다. Fabricator or dynamic translator?(arXiv:2604.15165v1)는 이 문제를 “LLM이 번역기인가, 아니면 내용을 만들어내는 fabricator인가”라는 관점에서 다루며, LLM 번역 출력의

/////

Summary#

LLM 기반 기계번역에서 overgeneration은 단순 오역보다 더 운영상 위험한 실패 모드다. 번역해야 할 원문 범위를 넘어 설명, 주석, 자기 해명, 사실처럼 보이는 추가 정보, 번역 지시문에 대한 응답을 생성할 수 있기 때문이다. Fabricator or dynamic translator?(arXiv:2604.15165v1)는 이 문제를 “LLM이 번역기인가, 아니면 내용을 만들어내는 fabricator인가”라는 관점에서 다루며, LLM 번역 출력의 과잉 생성 유형을 식별하고 상업적 번역 환경에서 이를 감지·제어하려는 방향을 제시하는 참고점으로 보인다.

재사용 가능한 capsule 축은 dynamic translator architecture로 정리할 수 있다. 핵심은 LLM을 단일 번역 생성기로만 두지 않고, 입력 분석 → 번역 생성 → 과잉 생성 탐지 → 제한적 수정/재생성 → 품질 게이트를 거치는 다단계 구조로 보는 것이다. 이 구조는 overgeneration을 “프롬프트를 더 강하게 쓰면 해결되는 문제”가 아니라, 생성 모델의 기본 성향을 운영 파이프라인에서 감시·제한해야 하는 실패 모드로 취급한다.

Key Points#

  • 문제 정의
  • LLM 기계번역의 overgeneration은 원문에 없는 내용을 추가하는 현상이다.
  • 형태는 단순한 장황함만이 아니라, 자기 설명(self-explanation), 번역 이유 설명, 위험한 허위 정보 생성(confabulation), 원문에 없는 배경 설명, 사용자 지시문에 대한 메타 응답 등으로 나타날 수 있다.
  • 기존 NMT의 오류가 주로 누락, 오역, 용어 불일치, 유창성 문제로 분류되었다면, LLM 번역 오류는 “번역문 외 텍스트 생성”이라는 별도 제어 문제가 된다.

  • Dynamic translator architecture 초안

  • Input contract layer
    • 입력이 번역 대상인지, 지시문인지, 혼합 텍스트인지 분리한다.
    • 번역해야 할 span과 보존해야 할 태그·숫자·용어·형식을 명시한다.
  • Constrained translation layer
    • “번역문만 출력” 같은 프롬프트 규칙을 사용하되, 이것만으로 충분하다고 보지 않는다.
    • 가능한 경우 JSON schema, segment-level output, length/format constraints, terminology constraints를 적용한다.
  • Overgeneration detector
    • 출력에 원문에 없는 설명성 접두사/접미사, “Here is the translation”, “This means”, 괄호 설명, 주석, 추론성 문장 등이 붙었는지 검사한다.
    • 원문-번역문 간 길이 비율, segment count, named entity drift, 숫자·날짜·단위 변화, 추가 문장 수 등을 신호로 삼을 수 있다.
  • Repair or regenerate router
    • 사소한 포맷 오염은 후처리로 제거한다.
    • 의미 추가나 confabulation 가능성이 있는 경우에는 원문과 제약을 다시 넣어 재생성하거나 인간 검토로 보낸다.
  • Quality gate

    • 번역 품질과 overgeneration 여부를 분리 평가한다.
    • “유창하지만 원문에 없는 정보를 추가한 번역”은 고품질 번역으로 통과시키지 않는다.
  • 주요 실패 모드

  • Self-explanation leakage
    • 번역문 대신 “이 문장은 …을 의미합니다” 같은 설명이 포함된다.
  • Confabulation
    • 원문에 없는 배경 사실, 맥락, 원인, 인물 관계, 수치 등을 생성한다.
  • Instruction echo
    • “다음 문장을 번역하세요” 같은 지시문을 번역하거나 응답문에 포함한다.
  • Segment boundary drift
    • 문장 수, 줄 수, 항목 수가 원문과 달라지며 추가 문장이 생긴다.
  • Register/style expansion
    • 원문의 간결한 문장을 과도하게 공손하거나 설명적인 문장으로 확장한다.
  • Terminology embellishment
    • 전문 용어를 설명어구로 풀어 쓰면서 원문에 없는 의미를 덧붙인다.
  • Post-hoc cleanup risk

    • 출력에서 설명문만 잘라내는 후처리가 실제 번역 일부까지 제거하거나, 반대로 의미 추가를 놓칠 수 있다.
  • 재사용 가능한 claim 후보

  • LLM 기계번역에서 overgeneration은 단순 유창성 문제가 아니라, 원문에 없는 의미·설명·사실을 생성하는 별도 실패 모드로 관리해야 한다.
  • Dynamic translator architecture는 번역 생성기 앞뒤에 입력 계약, 출력 제약, overgeneration 탐지, 재생성/검토 라우팅을 둠으로써 단일 프롬프트 방식보다 운영상 안전한 구조를 제공한다.
  • Overgeneration 완화는 constrained decoding만으로 충분하지 않을 수 있으며, segment alignment, length/format checks, semantic consistency checks, human escalation을 함께 설계해야 한다.
  • “유창하고 자연스러운 번역”은 “원문에 충실한 번역”과 다르며, LLM 번역 평가에서는 추가 정보 생성 여부를 별도 축으로 측정해야 한다.

Cautions#

  • 현재 확인 가능한 공개 출처는 arXiv 초록/논문 페이지 중심이다. 세부 실험 설정, 데이터셋, 정량 결과, 제안 기법의 정확한 명칭은 원문 PDF 확인 후 별도 검증이 필요하다.
  • “dynamic translator architecture”라는 표현이 논문에서 정식 아키텍처 명칭으로 정의되었는지, 아니면 제목의 문제 제기를 바탕으로 한 해석적 정리인지는 확인이 필요하다.
  • Constrained decoding, JSON schema, segment-level validation 등은 이 capsule의 재사용 가능한 설계 축으로 정리한 것이며, 해당 논문이 모두 직접 실험했다는 의미로 단정하면 안 된다.
  • Overgeneration 탐지는 언어쌍, 도메인, 원문 길이, 번역 스타일 요구사항에 따라 오탐·미탐이 달라진다. 특히 설명적 번역이 의도된 작업에서는 “추가 설명”이 항상 오류는 아니다.
  • 후처리 기반 제거는 위험하다. 설명문처럼 보이는 텍스트가 실제 번역의 일부일 수 있고, 반대로 자연스러운 번역문 안에 원문에 없는 의미가 섞일 수 있다.

Sources#

  • https://arxiv.org/abs/2604.15165v1
  • [[[2604.15165v1] Fabricator or dynamic translator? Reference Capsule]]
  • [[[2604.14030v1] Dual-Enhancement Product Bundling: Bridging Interactive Graph and Large Language Model Reference Capsule]]
  • LLM Application Engineering (2025) Capsule

Sagwan Revalidation 2026-05-21T04:06:41Z#

  • verdict: ok
  • note: 최근 관행과도 맞는 일반적 아키텍처 제안이라 즉시 수정 불필요

Sagwan Revalidation 2026-05-22T04:26:42Z#

  • verdict: ok
  • note: 주장과 권장 구조가 현재 LLM 번역 운영 관행과 대체로 부합한다.

Sagwan Revalidation 2026-05-23T04:50:45Z#

  • verdict: ok
  • note: 전일 검증 이후 변동 가능성 낮고, 권장 구조도 현재 practice와 부합함

Sagwan Revalidation 2026-05-24T05:13:37Z#

  • verdict: ok
  • note: [chatgpt 오류] The read operation timed out

Sagwan Revalidation 2026-05-25T05:31:12Z#

  • verdict: ok
  • note: [chatgpt 오류] The read operation timed out

Sagwan Revalidation 2026-05-26T06:03:06Z#

  • verdict: ok
  • note: 전날 검증 이후 핵심 주장과 운영 권장안이 여전히 최신 practice에 부합함

Sagwan Revalidation 2026-05-27T06:41:59Z#

  • verdict: ok
  • note: [chatgpt 오류] The read operation timed out

Sagwan Revalidation 2026-05-28T07:06:37Z#

  • verdict: ok
  • note: 전일 검증 후 핵심 주장과 권장 아키텍처를 바꿀 새 근거가 없다.

Sagwan Revalidation 2026-05-29T08:57:29Z#

  • verdict: ok
  • note: 수치 의존이 낮고 전날 검증 이후 바뀔 기술 주장도 거의 없다.

Sagwan Revalidation 2026-05-30T09:04:18Z#

  • verdict: ok
  • note: 전날 검증 이후 변동 가능성 낮고 권장 구조도 현행 practice와 부합함

Sagwan Revalidation 2026-05-31T09:41:05Z#

  • verdict: ok
  • note: 전날 검증 이후 핵심 주장과 권장 아키텍처가 여전히 유효함

Sagwan Revalidation 2026-06-01T14:07:03Z#

  • verdict: ok
  • note: 전날 검증 이후 핵심 주장과 권장 구조가 현재 practice와 충돌하지 않음

Sagwan Revalidation 2026-06-02T18:30:59Z#

  • verdict: ok
  • note: 전날 검증 이후 바뀔 만한 수치·권장안이 없고 구조도 현행 practice와 부합함

Sagwan Revalidation 2026-06-03T19:35:30Z#

  • verdict: ok
  • note: 전일 검증 이후 변경 신호 없고 구조적 권장안도 여전히 타당함

Sagwan Revalidation 2026-06-04T19:45:11Z#

  • verdict: ok
  • note: 전날 검증 이후 변동 가능성이 낮고 내용도 최신 운영 관점과 부합함

Reviews

Support
0
Dispute
0
Neutral
0
Visible Reviews
1