Summary#
IchiMozzi의 JLPT 문법 카테고리에서 서브패턴-subpattern을 실제 문형-bunkei / grammar pattern에 매핑할 때는, 단순 문자열 매칭보다 형태소적 변형 + 접속 형태 + 의미 기능 + JLPT 항목명 우선순위를 함께 보는 규칙이 필요하다.
특히 다음 범주는 모호성이 크다.
- 수동형 / 사역형 / 사역수동형
- 가능형
- 의지형
- 조건형
- て형 연결
- 명사화・인용・보문 구조
- 유사 표면형을 공유하는 JLPT 문법 항목
공개 자료 기준으로 JLPT 문법 목록은 사이트별로 항목명과 레벨 배치가 조금씩 다르며, 공식 JLPT가 완전한 문법 taxonomy를 공개하는 것은 아니므로, IchiMozzi 내부 taxonomy는 검증 가능한 공개 grammar list + 자체 precedence rule + ambiguity fallback 구조로 설계하는 것이 안전하다.
Key Points#
1. 매핑 단위는 “표면 문자열”이 아니라 “접속 슬롯 + 기능”이어야 한다#
예를 들어 Vて는 단독 문법 항목이 아니라 여러 문형의 접속 기반이 된다.
VているVてあるVてしまうVておくVてみるVてもいいVてはいけないVてからVてばかりいる
따라서 subpattern이 te-form이면 곧바로 하나의 문형으로 확정하지 말고, 뒤따르는 보조동사・조사・접속 표현까지 포함해 매핑해야 한다.
권장 규칙:
- 가장 긴 문형 후보를 먼저 매칭한다.
-
Vてしまう는Vて+しまう로 분해하기 전에 하나의 grammar pattern으로 우선 인식. て뒤의 auxiliary / particle / connective를 확인한다.- 후속 요소가 없으면 “형태 분류 te-form”으로만 태깅하고 JLPT 문법 문형으로 확정하지 않는다.
2. 수동・사역・가능형은 형태가 겹치므로 동사 유형 판정이 선행되어야 한다#
일본어 동사 변형에서는 표면형만 보면 다음이 충돌할 수 있다.
食べられる- 가능형: 먹을 수 있다
- 수동형: 먹힌다 / 먹게 되다
- 존경 표현 가능성
行かれる- 수동형
- 존경형
- 가능형으로는 보통
行ける가 자연스러움 させられる- 사역수동형
- 문맥에 따라 “강제로 하게 되다”
권장 precedence:
- 명시적 ending:
-
させられる,される→ causative-passive 후보 우선 -せる,させる→ causative 후보 -れる,られる→ passive / potential / honorific ambiguity pool - 동사 그룹 확인:
- ichidan +
られる는 passive/potential/honorific 모두 가능 - godan potential은 보통-eru계열로 별도 표면형 - 의미 단서 확인:
- agent marked by
に/によって→ passive 가능성 증가 - ability adverbs or context,ことができるparaphrase 가능 → potential 가능성 증가 - subject honorific context → honorific 가능성 증가 - 문맥 부족 시 단일 매핑 금지:
-
ambiguous: passive_or_potential_or_honorific로 보존
3. 조건형은 ば, たら, なら, と를 같은 category에 넣되 의미 차이를 잃으면 안 된다#
JLPT 문법 목록에서는 조건 표현이 여러 레벨과 문형으로 분산된다.
〜ば〜たら〜なら〜と〜ても〜としても〜にしても〜限り〜限りでは〜限りは
실패 모드:
- 모든 conditional을
if로만 매핑하면 생성 문제에서 오답 선택지가 너무 쉽게 되거나, 반대로 정답이 여러 개가 된다. と조건은 자연 법칙・기계적 결과에 강하고, 의지・명령 표현과 결합 제약이 있다.なら는 화제 제시・상대 발화 기반 조건에 가까운 경우가 많다.たら는 시간적 선후와 조건이 겹친다.
권장 subpattern schema:
conditional:
surface: ["ば", "たら", "なら", "と"]
semantic_axis:
- hypothetical
- temporal_sequence
- general_condition
- topic_based_condition
- concessive
generation_constraints:
- allows_volitional_main_clause
- blocks_command_or_request
- requires_past_ta_form
4. 의지형은 “volitional form”과 “문형”을 분리해야 한다#
行こう, 食べよう 같은 의지형은 형태 범주이지만, JLPT 문법 항목에서는 다음과 결합해 별도 문형을 만든다.
〜ようと思う〜ようとする〜ようにする〜ようになる〜ようでは〜ようなら〜ようがない
실패 모드:
よう을 모두 volitional로 처리하면〜ようになる,〜ようにする같은 목적・변화 문형을 잘못 분류한다.ようだ의 양태・비유・추정과 volitionalよう이 충돌한다.
권장 규칙:
V-volitional + とする / と思う→ volitional intent patternV-dictionary / Vない + ようにする→ habitual effort / arrangementV-dictionary / Vない + ようになる→ change of stateN/Adj + の/な + ようだ→ resemblance / seeming, volitional 아님
5. “긴 문형 우선” precedence가 필요하다#
JLPT 문법 항목은 서로 포함 관계를 갖는다.
예:
〜に対して- 내부에
に가 있지만 particleに로 분해하면 안 됨 〜ことにすること명사화로만 처리하면 안 됨〜わけではないわけ명사로만 처리하면 안 됨〜なければならない- conditional
なければ+ならない로만 보면 obligation 의미를 잃음 〜てもいい- concessive
ても가 아니라 permission pattern
권장 precedence:
1. Fixed multi-token JLPT grammar expression
2. Semi-fixed expression with inflection slot
3. Auxiliary construction
4. Conjugation category
5. Particle-level fallback
6. Unknown / ambiguous
6. 생성・검수 파이프라인에서는 “정답 하나 보장” 규칙이 중요하다#
문법 문제 생성에서 taxonomy mapping이 모호하면 다음 실패가 생긴다.
- 정답이 2개 이상 가능
- 오답 선택지가 실제로도 자연스러움
- 목표 문법보다 더 쉬운 문법으로 풀림
- 문장 의미가 바뀌어도 형식만 맞는 선택지가 정답 처리됨
- JLPT 레벨이 섞여 난이도 통제가 실패함
예시 실패 모드:
Target: 〜てもいい
Sentence: ここで写真を撮って____。
Choices:
A. もいい
B. はいけない
C. しまう
D. おく
이 경우 撮ってもいい와 撮ってはいけない는 모두 문법적으로 가능하지만 의미가 반대다. 문맥이 허가인지 금지인지 명확하지 않으면 distractor 검수가 실패한다.
권장 validation:
- target pattern의 semantic function을 명시한다.
- distractor는 같은 접속 형태를 공유하되 의미상 정답이 되지 않도록 문맥 제약을 추가한다.
- 생성 후 “alternate valid answer” 검사를 수행한다.
- 문장 의미 없이 표면 접속만 검사하는 validator는 금지한다.
7. IchiMozzi용 capsule draft schema 제안#
capsule_type: private_taxonomy_mapping_rule
topic: IchiMozzi JLPT grammar subpattern-bunkei mapping
status: draft
confidence: medium
mapping_principles:
- longest_pattern_first
- conjugation_before_semantic_resolution
- semantic_function_required_for_generation
- ambiguity_preservation_over_forced_labeling
- jlpt_level_as_metadata_not_primary_classifier
core_axes:
form_axis:
- dictionary
- nai
- ta
- te
- volitional
- conditional_ba
- passive
- causative
- causative_passive
- potential
function_axis:
- permission
- prohibition
- obligation
- intention
- attempt
- change_of_state
- condition
- concession
- passive_voice
- ability
- honorific
surface_axis:
- fixed_expression
- auxiliary_chain
- particle_compound
- inflected_verb
- clause_connector
precedence:
- exact_fixed_expression
- longest_jlpt_pattern
- inflection_plus_auxiliary
- conjugation_class
- semantic_disambiguation
- ambiguous_fallback
ambiguity_policy:
passive_potential_honorific:
action: preserve_multiple_candidates
require_context_for_resolution: true
te_form:
action: do_not_map_to_single_bunkei_without_following_auxiliary
you:
action: distinguish_volitional_you_from_youdescriptive
conditional:
action: keep_surface_specific_semantic_constraints
Cautions#
- 공개 검색 가능한 자료에서 IchiMozzi 고유의 공식 taxonomy 문서나 내부 subpattern-bunkei 매핑 규칙은 확인되지 않았다. 따라서 위 내용은 공개 JLPT 문법 목록과 일반 일본어 문법 설명을 바탕으로 한 private capsule 초안이다.
- JLPT 공식 기관은 상세 문법 항목 전체를 공식 syllabus처럼 완전 공개하지 않는다. JLPT Sensei, Japanesetest4you, Bunpro 등의 목록은 학습자용 taxonomy로 유용하지만 사이트별 분류와 레벨 배치가 다를 수 있다.
られる계열은 passive / potential / honorific이 실제 문맥 없이 완전히 분리되지 않는다. 자동 분류기가 하나의 label로 강제 확정하면 오류 가능성이 높다.て형은 너무 범용적이므로 단독 문법 category로 쓰면 distractor 생성과 검수에서 실패가 자주 발생한다.- 조건형은 영어
if로 평탄화하면 안 된다.ば,たら,なら,と는 생성 제약과 의미 기능이 다르다. - 문법 문제 생성에서는 형태상 가능한 선택지가 아니라, 문맥상 유일한 정답인지 검증해야 한다.
Sources#
- https://jlptsensei.com/jlpt-n5-grammar-list/
- https://jlptsensei.com/jlpt-n4-grammar-list/
- https://jlptsensei.com/jlpt-n3-grammar-list/
- https://jlptsensei.com/jlpt-n2-grammar-list/
- https://jlptsensei.com/jlpt-n1-grammar-list/
- https://japanesetest4you.com/jlpt-n5-grammar-list/
- https://japanesetest4you.com/jlpt-n4-grammar-list/
- https://japanesetest4you.com/jlpt-n3-grammar-list/
- https://guidetojapanese.org/learn/grammar/teform
- https://guidetojapanese.org/learn/grammar/causepass
- https://guidetojapanese.org/learn/grammar/conditionals
- https://bunpro.jp/grammar_points
Related#
- JLPT Grammar Subpattern-to-Item Template Mapping for LLM Question Generation
- IchiMozzi JLPT Problem Generation Validation Architecture and Failure Modes
- LLM-Generated JLPT Item Validation: Schema Repair, Difficulty Drift, and Distractor Failure Modes
Sagwan Revalidation 2026-05-10T00:05:44Z#
- verdict:
ok - note: 공식 taxonomy 부재와 형태소+문맥 기반 매핑 원칙은 여전히 유효함
Sagwan Revalidation 2026-05-11T00:20:25Z#
- verdict:
ok - note: 공식 taxonomy 부재와 매핑 원칙은 여전히 타당하며 갱신 필요 낮음
Sagwan Revalidation 2026-05-12T00:38:34Z#
- verdict:
ok - note: [chatgpt HTTP 401] {
Sagwan Revalidation 2026-05-13T01:12:02Z#
- verdict:
ok - note: 공식 JLPT 문법 비공개와 형태소 기반 우선순위 권장은 현재도 타당함
Sagwan Revalidation 2026-05-14T01:30:30Z#
- verdict:
ok - note: 공식 taxonomy 부재와 형태·기능 기반 매핑 권장은 여전히 유효함
Sagwan Revalidation 2026-05-15T01:40:44Z#
- verdict:
ok - note: 공식 taxonomy 부재와 형태소·접속 기반 매핑 원칙은 여전히 유효함
Sagwan Revalidation 2026-05-16T01:53:44Z#
- verdict:
ok - note: 공개 JLPT taxonomy 부재와 형태·의미 기반 매핑 권장은 여전히 타당함
Sagwan Revalidation 2026-05-17T02:13:33Z#
- verdict:
ok - note: 공개 JLPT 문법 목록·형태소 기반 매핑 원칙은 여전히 유효함
Sagwan Revalidation 2026-05-18T02:34:20Z#
- verdict:
ok - note: 공개 JLPT 문법 taxonomy 부재와 매핑 원칙은 여전히 유효함
Sagwan Revalidation 2026-05-19T02:34:53Z#
- verdict:
ok - note: 공개 JLPT 문법 taxonomy 부재와 형태소 기반 매핑 원칙은 여전히 유효함
Sagwan Revalidation 2026-05-20T02:48:51Z#
- verdict:
ok - note: 공개 JLPT 문법 비공식성 및 형태·의미 기반 매핑 원칙은 여전히 유효함
Sagwan Revalidation 2026-05-21T02:51:21Z#
- verdict:
ok - note: 공개 JLPT taxonomy 부재와 형태소 기반 매핑 권장은 여전히 유효함
Sagwan Revalidation 2026-05-22T03:13:35Z#
- verdict:
ok - note: 일반 원칙 위주라 최신 practice와 충돌 없고 재사용 가능함
Sagwan Revalidation 2026-05-23T03:28:08Z#
- verdict:
ok - note: 공식 JLPT taxonomy 부재와 형태소 기반 매핑 권장은 여전히 유효함
Sagwan Revalidation 2026-05-24T03:52:48Z#
- verdict:
ok - note: 공개 JLPT 문법 taxonomy 부재와 형태소 기반 매핑 원칙은 여전히 유효함
Sagwan Revalidation 2026-05-25T04:12:21Z#
- verdict:
ok - note: [chatgpt 오류] The read operation timed out
Sagwan Revalidation 2026-05-26T05:25:22Z#
- verdict:
ok - note: 일반 원칙 중심이라 공개 JLPT/문법 처리 관행과 여전히 부합함
Sagwan Revalidation 2026-05-27T05:54:04Z#
- verdict:
ok - note: JLPT 문법 taxonomy 비공식성과 매핑 권장안은 현재도 타당함
Sagwan Revalidation 2026-05-28T06:29:06Z#
- verdict:
ok - note: 공식 taxonomy 부재와 형태·기능 기반 매핑 권고는 여전히 유효함
Sagwan Revalidation 2026-05-29T08:57:12Z#
- verdict:
refresh - note:
される를 사역수동 우선 후보로 둔 부분은 부정확해 수정 가치가 있음
Sagwan Revalidation 2026-05-30T09:04:00Z#
- verdict:
ok - note: 공개 JLPT taxonomy 부재와 형태소 기반 매핑 권장은 여전히 유효함
Sagwan Revalidation 2026-05-31T09:40:54Z#
- verdict:
ok - note: 공개 JLPT 문법 taxonomy 부재와 매핑 원칙은 여전히 유효함
Sagwan Revalidation 2026-06-01T14:06:48Z#
- verdict:
ok - note: 공식 taxonomy 부재와 형태·의미 기반 매핑 원칙은 여전히 유효함
Sagwan Revalidation 2026-06-02T17:46:27Z#
- verdict:
ok - note: 공개 JLPT taxonomy 부재와 매핑 원칙은 여전히 유효하다.
Sagwan Revalidation 2026-06-03T18:56:08Z#
- verdict:
ok - note: 공개 JLPT 문법 목록·형태소 기반 매핑 원칙 모두 여전히 유효함
Sagwan Revalidation 2026-06-04T19:09:19Z#
- verdict:
ok - note: JLPT 비공식 taxonomy 전제와 매핑 규칙은 현재도 타당하다.