JLPT Grammar Subpattern-to-Item Template Mapping for LLM Question Generation

JLPT 문법 생성·검수 파이프라인에 바로 쓰기 좋은 분류 체계는 “문법 포인트 목록”만으로는 부족하다. 최소한 다음 3축을 함께 저장해야 한다. 1. 기능 카테고리 : 조건, 이유·원인, 목적, 역접·양보, 시간·순서, 추측·전문, 의무·금지·허가 등 의미 기능 2. 서브패턴 / 접속형 : V辞書形, Vない形, Vた形, Vて形, 名詞＋の, 名詞＋に, い形容詞, な形容詞 등 실제 결합 형태 3. 문항형 매핑 : 문법형식 판단, 문장 배열, 글 안의 문법·담화 결

Summary#

JLPT 문법 생성·검수 파이프라인에 바로 쓰기 좋은 분류 체계는 “문법 포인트 목록”만으로는 부족하다. 최소한 다음 3축을 함께 저장해야 한다.

기능 카테고리: 조건, 이유·원인, 목적, 역접·양보, 시간·순서, 추측·전문, 의무·금지·허가 등 의미 기능
서브패턴 / 접속형: V辞書形, Vない形, Vた形, Vて形, 名詞＋の, 名詞＋に, い形容詞, な形容詞 등 실제 결합 형태
문항형 매핑: 문법형식 판단, 문장 배열, 글 안의 문법·담화 결속성 등 JLPT식 문제 유형

공식 JLPT 자료는 각 레벨의 언어 지식·문법 능력과 문제 유형을 설명하지만, N1–N5 전체 문법 포인트를 기능별로 분류한 공식 taxonomy는 공개하지 않는다. 따라서 구현용 분류 체계는 공식 시험 구조를 기준으로 삼고, 개별 문형 리스트는 비공식 공개 자료를 보조 자료로 사용하되 검수 레이어에서 “공식성 없음”을 명시해야 한다.

Key Points#

1. 권장 데이터 모델#

문법 포인트 하나를 다음과 같이 저장하면 N1–N5 크로스레벨 생성·검수에 재사용하기 쉽다.

grammar_id: n3-tameni
level: N3
surface_pattern: ために
canonical_meaning: "~하기 위해 / ~때문에"
functional_category:
  primary: purpose
  secondary: cause_reason
subpattern:
  connection:
    - V辞書形 + ために
    - N + の + ために
  polarity: affirmative
  clause_position: subordinate_clause
item_type_fit:
  form_selection: high
  sentence_ordering: high
  text_grammar: medium
confusable_with:
  - ように
  - せいで
  - おかげで
generation_notes:
  - 목적 용법과 원인 용법을 같은 문항 안에서 혼동시키지 말 것
  - 목적 용법은 의지동사와 잘 결합
review_flags:
  - semantic_role_check
  - connection_form_check

2. 기능 카테고리 상위 분류안#

N1–N5 전체를 한 taxonomy로 다루려면 다음 정도의 상위 카테고리가 실용적이다.

상위 카테고리	설명	대표 예시
시간·순서	사건의 시점, 전후, 동시성	てから, まえに, あとで, うちに
조건	if/when 조건, 가정, 일반 조건	と, ば, なら, たら, かぎり
이유·원인	because, due to	から, ので, ために, せいで, おかげで
목적	in order to	ために, ように
역접·양보	although, even if, despite	が, けど, のに, ても, ものの
병렬·첨가	and, also, not only	し, たり, だけでなく
비교·대조	more than, rather than, unlike	より, ほど, に比べて, 一方
예시·열거	for example, such as	など, とか, やら
한정·범위	only, merely, as far as	だけ, しか, ばかり, に限り
정도·강조	extent, so much that	くらい, ほど, ばかりに
가능·능력	can, be able to	ことができる, られる
수동·사역	passive, causative, causative-passive	れる・られる, せる・させる
의무·금지·허가	must, must not, may	なければならない, てはいけない, てもいい
의지·권유·명령	volition, invitation, command	ましょう, ませんか, なさい
추측·판단	seems, probably, must be	でしょう, かもしれない, はず, らしい
전문·양태	hearsay, appearance	そうだ, ようだ, みたいだ
경어	존경어, 겸양어, 정중어	お〜になる, お〜する, です・ます
인용·전달	quotation, reported thought/speech	と言う, と思う
명사화·형식명사	clause nominalization	こと, の, もの, わけ
담화 연결	text-level cohesion	しかし, そのため, つまり, ところが

3. 레벨별 진행 구조#

공식 JLPT는 레벨별로 요구되는 언어 지식과 독해 난이도를 구분하지만, 개별 문형의 완전한 공식 목록은 제공하지 않는다. 구현용으로는 다음과 같이 난이도 progression을 설정할 수 있다.

레벨	문법 특징	생성·검수 포인트
N5	기본 활용, 기본 조사, です・ます, て形, ない形, 기본 시간·장소·방향 표현	접속형 오류, 조사 선택 오류, 기본 어순 오류 중심
N4	조건, 의무·허가·금지, 경험, 비교, 가능, 수수표현 기초	と・ば・たら・なら 혼동, てもいい/てはいけない 구분
N3	복합 접속, 목적·원인·역접, 추측·양태, 담화 연결 기초	의미 기능이 비슷한 문형 간 distractor 설계 가능
N2	형식명사, 평가·판단, 제한·정도, 복합 접속, 문어적 표현 증가	의미 제약, register, 앞뒤 담화 호응 검수 필요
N1	고급 문어체, 관용적 문형, 강한 제약을 가진 접속 표현, 담화·논리 구조	단순 번역식 생성 금지, 실제 공기 관계와 문체 검수 필요

4. 문항형 매핑#

JLPT 문법 문항은 레벨과 시험 구성에 따라 문제 번호가 달라질 수 있으므로, 구현에서는 문제 번호보다 문항 기능으로 normalize하는 편이 안전하다.

문항형	핵심 평가 대상	잘 맞는 카테고리	생성 시 주의
문법형식 판단	빈칸에 맞는 문법 형식 선택	접속형이 명확한 조건, 이유, 목적, 역접, 의무, 추측	distractor는 같은 의미권 또는 같은 접속형에서 뽑되 정답이 1개여야 함
문장 배열	어절·구를 올바른 순서로 배열	복합 문형, 형식명사, 보조동사, 수식 구조	정답 순서가 복수로 가능하지 않게 조사와 수식 범위 고정
글 안의 문법	문맥 속 연결어·지시어·담화 문법 선택	담화 연결, 역접, 원인·결과, 예시, 요약	앞뒤 문장의 논리관계가 명시적이어야 함
독해 연계 문법	문법 의미가 문장 해석에 직접 영향	양보, 조건, 추측, 한정, 비교	문법 지식 없이도 상식으로 풀리는 문항은 피함

5. 카테고리-서브패턴-문항형 매핑 예시#

기능 카테고리	서브패턴 예시	레벨 범위	적합 문항형	대표 failure mode
조건	V辞書形＋と, Vば, Vたら, Nなら	N4–N2	문법형식 판단, 글 안의 문법	と/ば/たら/なら의 조건 성격 혼동
이유·원인	から, ので, ために, せいで, おかげで	N5–N2	문법형식 판단	긍정·부정 평가가 필요한 せいで/おかげで 혼동
목적	V辞書形＋ために, Vように	N4–N3	문법형식 판단, 문장 배열	의지동사/무의지동사 제약 무시
역접·양보	が, のに, ても, ものの, とはいえ	N5–N1	글 안의 문법	앞뒤 문맥이 실제로 역접이 아닌 경우
시간·순서	てから, まえに, あとで, うちに, ところ	N5–N2	문장 배열, 문법형식 판단	기준 시점과 사건 순서 불일치
의무·금지·허가	なければならない, てはいけない, てもいい	N5–N4	문법형식 판단	의미가 너무 쉬워져 문법보다 상식 문제화
추측·양태	でしょう, かもしれない, はず, らしい, ようだ	N5–N2	문법형식 판단, 글 안의 문법	근거 기반 추측/전문/양태 구분 실패
수동·사역	Vれる/られる, Vせる/させる	N4–N3	문장 배열, 문법형식 판단	행위자·피행위자 역할 오류
경어	お〜になる, お〜する, いたす, くださる	N4–N2	문법형식 판단	존경어와 겸양어 방향성 오류
담화 연결	しかし, そのため, つまり, 一方	N3–N1	글 안의 문법	접속사의 논리관계가 앞뒤 문맥과 불일치

6. 구현용 검수 규칙#

문법 문항 생성 후 자동·수동 검수는 다음 순서가 좋다.

접속형 검수
- 앞말이 동사인지, 명사인지, い형용사인지, な형용사인지 확인
- 사전형, ない형, た형, て형 등 요구 형태 확인
의미 기능 검수
- 목적, 원인, 조건, 역접 등 문맥 논리가 실제로 맞는지 확인
- 같은 표면형이 여러 기능을 가질 경우 하나로 고정
레벨 검수
- 문형 자체 레벨뿐 아니라 어휘, 한자, 문장 길이도 목표 레벨에 맞는지 확인
distractor 검수
- 오답이 문법적으로 완전히 불가능한지, 혹은 의미상만 부적절한지 라벨링
- 정답이 2개 이상 될 수 있는 접속사·조건 표현은 제외
문항형 검수
- 문법형식 판단: 빈칸 앞뒤 접속 조건이 충분한가
- 문장 배열: 복수 배열 가능성이 없는가
- 글 안의 문법: 앞뒤 담화 관계가 명확한가

Cautions#

JLPT 공식 사이트는 시험 구성, 레벨별 능력 설명, 샘플 문제를 제공하지만, N1–N5 전체 문법 포인트의 공식 taxonomy나 공식 문형 목록을 공개적으로 확정 제시하지 않는다.
문제 번호, 예컨대 問題7・問題8・問題9는 레벨·섹션·공개 샘플 구성에 따라 달라질 수 있다. 따라서 implementation에서는 “문제 번호”보다 “문법형식 판단 / 문장 배열 / 글 안의 문법” 같은 문항 기능으로 정규화하는 것이 안전하다.
JLPT Sensei, Tanos 등 공개 문형 리스트는 실무상 유용하지만 공식 출제 기관 자료가 아니므로, 레벨 태그와 문형 해설을 그대로 authoritative source로 취급하면 안 된다.
“조건”, “원인”, “목적” 같은 기능 분류는 일본어 교육 문법에서 널리 쓰이는 방식이지만, 문형 하나가 여러 기능을 가질 수 있다. 예: ために는 목적과 원인 양쪽으로 쓰일 수 있다.
LLM 생성에서는 표면 문형만 맞고 의미 제약이 틀리는 failure mode가 자주 발생한다. 특히 ように/ために, ので/のに, はず/べき, そうだ/ようだ/らしい는 별도 confusion set으로 관리하는 것이 좋다.

Sources#

https://www.jlpt.jp/e/about/levelsummary.html
https://www.jlpt.jp/e/guideline/testsections.html
https://www.jlpt.jp/e/samples/forlearners.html
https://jlptsensei.com/jlpt-grammar-list/
http://www.tanos.co.uk/jlpt/grammar/

Sagwan Revalidation 2026-05-08T14:57:30Z#

verdict: ok
note: 공식 JLPT 범위 공개 상황과 권장 분류 모델 모두 현재도 타당함

Sagwan Revalidation 2026-05-09T15:10:00Z#

verdict: ok
note: 공식 JLPT 범위와 생성용 분류 권장안 모두 현재도 재사용 가능함

Sagwan Revalidation 2026-05-10T15:31:21Z#

verdict: ok
note: 공식 JLPT 공개 범위와 구현용 분류 권장은 현재도 유효함

Sagwan Revalidation 2026-05-11T15:32:37Z#

verdict: ok
note: 공식 JLPT 분류 부재와 3축 데이터 모델 권장은 여전히 타당함

Sagwan Revalidation 2026-05-12T15:54:56Z#

verdict: ok
note: 공식 JLPT 공개 범위와 구현 권장 구조가 현재도 무리 없이 유효함

Sagwan Revalidation 2026-05-13T15:57:10Z#

verdict: ok
note: 공식 JLPT 분류 부재와 구현용 3축 모델 모두 여전히 유효함

Sagwan Revalidation 2026-05-14T16:13:25Z#

verdict: ok
note: 공식 JLPT 구조와 비공식 문형 분류 한계 설명이 여전히 유효함

Sagwan Revalidation 2026-05-15T16:25:35Z#

verdict: ok
note: 공식 JLPT 공개 범위와 권장 데이터 모델 모두 현재도 재사용 가능함

Sagwan Revalidation 2026-05-16T17:00:39Z#

verdict: ok
note: 공식 JLPT 분류 부재와 구현용 3축 모델 권장은 여전히 타당함

Sagwan Revalidation 2026-05-17T17:29:31Z#

verdict: ok
note: 공식 JLPT 구조와 비공식 문형 보조 사용 원칙은 여전히 유효함

Sagwan Revalidation 2026-05-18T17:50:45Z#

verdict: ok
note: 공식 JLPT 공개 범위와 구현용 분류 권장안 모두 현재도 유효함

Sagwan Revalidation 2026-05-19T18:16:32Z#

verdict: ok
note: 공식 JLPT 공개 범위와 분류·모델링 권장안 모두 현재도 무리 없다.

Sagwan Revalidation 2026-05-20T18:48:47Z#

verdict: ok
note: 공식 JLPT 범위와 비공식 목록 활용 원칙 모두 현재도 재사용 가능함

Sagwan Revalidation 2026-05-21T19:17:18Z#

verdict: ok
note: 공식 JLPT 분류 부재와 구현용 3축 모델 권장은 여전히 타당함

Sagwan Revalidation 2026-05-22T19:22:23Z#

verdict: ok
note: 공식 JLPT 공개 범위와 구현용 분류 권장안 모두 현재도 무리 없다.

Sagwan Revalidation 2026-05-23T19:29:45Z#

verdict: ok
note: 공식 JLPT taxonomy 부재와 구현용 3축 모델 권장은 여전히 타당함

Sagwan Revalidation 2026-05-24T19:55:19Z#

verdict: ok
note: 공식 JLPT 구조와 비공식 taxonomy 한계 설명은 현재도 유효함

Sagwan Revalidation 2026-05-25T20:28:38Z#

verdict: ok
note: 공식 JLPT 분류 공개 현황과 권장 모델 모두 현재도 재사용 가능함

Sagwan Revalidation 2026-05-26T20:43:50Z#

verdict: ok
note: 공식 JLPT 공개 범위와 권장 모델 모두 최근 기준에서 여전히 유효함

Sagwan Revalidation 2026-05-27T21:04:22Z#

verdict: ok
note: 공식 JLPT 구조와 비공식 문형 목록 활용 방침 모두 현재도 타당함

Sagwan Revalidation 2026-05-28T21:35:21Z#

verdict: ok
note: 공식 JLPT 분류 부재와 권장 모델 내용은 현재도 재사용 가능함.

Sagwan Revalidation 2026-05-29T21:42:33Z#

verdict: ok
note: 공식 JLPT 분류 부재와 구현용 3축 모델 권장은 여전히 타당함

Sagwan Revalidation 2026-05-30T22:19:25Z#

verdict: ok
note: 공식 JLPT 공개 범위와 구현 권장 모델 모두 현재도 무리 없이 유효함

Sagwan Revalidation 2026-06-01T04:13:11Z#

verdict: ok
note: 공식 JLPT taxonomy 부재와 3축 모델 권장은 현재도 재사용 가능함

Sagwan Revalidation 2026-06-02T04:57:58Z#

verdict: ok
note: 공식 JLPT 분류 부재와 구현용 3축 모델 권장은 여전히 타당함

Sagwan Revalidation 2026-06-03T05:36:02Z#

verdict: ok
note: 공식 JLPT taxonomy 부재와 구현용 3축 모델 권장은 여전히 타당함

Sagwan Revalidation 2026-06-04T06:11:58Z#

verdict: ok
note: 공식 JLPT taxonomy 부재와 구현용 3축 모델 권장은 여전히 유효함

Sagwan Revalidation 2026-06-05T06:37:45Z#

verdict: ok
note: 공식 JLPT 분류 한계와 구현용 3축 모델 모두 현재도 재사용 가능함

Sagwan Revalidation 2026-06-06T06:48:19Z#

verdict: ok
note: 공식 JLPT 문형 taxonomy 부재와 권장 데이터 모델 모두 여전히 유효함

Sagwan Revalidation 2026-06-07T07:18:35Z#

verdict: ok
note: 공식 JLPT 분류 부재와 3축 데이터 모델 권장은 여전히 유효함

Sagwan Revalidation 2026-06-08T07:54:38Z#

verdict: ok
note: 공식 JLPT 구조와 비공식 taxonomy 부재 판단은 현재도 유효함

Sagwan Revalidation 2026-06-09T08:28:46Z#

verdict: ok
note: 공식 JLPT taxonomy 부재와 권장 모델 내용은 현재도 재사용 가능함

Sagwan Revalidation 2026-06-10T11:53:29Z#

verdict: ok
note: 공식 JLPT 구조와 비공식 문형 분류 한계 설명은 여전히 유효함

Sagwan Revalidation 2026-06-11T12:17:18Z#

verdict: ok
note: 공식 JLPT 분류 부재와 3축 모델 권장은 현재도 재사용 가능함

Sagwan Revalidation 2026-06-12T13:02:18Z#

verdict: ok
note: [chatgpt HTTP 401] {

Sagwan Revalidation 2026-06-13T13:14:59Z#

verdict: ok
note: 공식 JLPT 구조와 비공식 문형 분류의 한계 설명이 여전히 유효함

Sagwan Revalidation 2026-06-14T13:35:59Z#

verdict: ok
note: 공식 JLPT taxonomy 부재와 구현용 3축 모델 권장은 여전히 타당함

Sagwan Revalidation 2026-06-15T14:27:25Z#

verdict: ok
note: 공식 JLPT 분류 부재와 제안 모델 모두 현재도 재사용 가능함

Sagwan Revalidation 2026-06-16T15:36:18Z#

verdict: ok
note: 공식 JLPT 범위와 문항형 관련 주장은 현재도 재사용 가능함

Sagwan Revalidation 2026-06-17T16:08:20Z#

verdict: ok
note: 최근 변화 가능성이 낮고 공식 taxonomy 부재 주장도 여전히 타당함

Sagwan Revalidation 2026-06-18T16:15:36Z#

verdict: ok
note: 공식 JLPT taxonomy 부재와 구현용 3축 모델 권장은 여전히 유효함

Sagwan Revalidation 2026-06-19T17:38:07Z#

verdict: ok
note: 공식 JLPT taxonomy 부재와 3축 데이터 모델 권장은 현재도 타당함

Sagwan Revalidation 2026-06-20T17:57:57Z#

verdict: ok
note: 공식 JLPT 공개 범위와 구현용 분류 권장안 모두 여전히 유효함

Sagwan Revalidation 2026-06-21T19:44:33Z#

verdict: ok
note: 공식 JLPT 범위와 비공식 taxonomy 한계 설명이 여전히 타당함

Sagwan Revalidation 2026-06-22T19:52:33Z#

verdict: ok
note: [chatgpt HTTP 401] {

Sagwan Revalidation 2026-06-23T20:23:37Z#

verdict: ok
note: [chatgpt HTTP 401] {

Sagwan Revalidation 2026-06-24T21:12:21Z#

verdict: ok
note: [chatgpt HTTP 401] {

Sagwan Revalidation 2026-06-25T21:44:07Z#

verdict: ok
note: 공식 JLPT 범위와 비공식 문형 활용 전제 모두 현재도 유효함

Sagwan Revalidation 2026-06-27T02:15:49Z#

verdict: ok
note: 공식 JLPT 범위와 구현 권장안 모두 현재도 무리 없이 재사용 가능

Sagwan Revalidation 2026-06-28T03:43:13Z#

verdict: ok
note: 공식 JLPT 분류 부재와 3축 모델 권장은 현재도 재사용 가능함

Sagwan Revalidation 2026-06-29T04:37:29Z#

verdict: ok
note: 공식 taxonomy 부재와 구현용 3축 모델 권장은 여전히 유효함

Sagwan Revalidation 2026-06-30T05:12:50Z#

verdict: ok
note: 공식 JLPT taxonomy 부재와 권장 데이터 모델 모두 현재도 재사용 가능.

Sagwan Revalidation 2026-07-01T12:22:06Z#

verdict: ok
note: 공식 JLPT 공개 범위와 구현 권장안 모두 현재도 재사용 가능함

Sagwan Revalidation 2026-07-03T00:48:38Z#

verdict: ok
note: 공식 JLPT 범위와 비공식 문형 taxonomy 전제 모두 현재도 유효함

Sagwan Revalidation 2026-07-04T11:55:01Z#

verdict: ok
note: 공식 JLPT 구조와 비공식 문형 분류 한계 설명은 여전히 유효함

Sagwan Revalidation 2026-07-05T13:54:24Z#

verdict: ok
note: 공식 taxonomy 부재와 3축 모델 권장은 현재도 재사용 가능함

Sagwan Revalidation 2026-07-06T20:47:30Z#

verdict: ok
note: 공식 JLPT 구조와 비공식 문형 목록 활용 원칙은 여전히 유효함

Sagwan Revalidation 2026-07-08T03:20:18Z#

verdict: ok
note: 공식 JLPT taxonomy 부재와 구현용 3축 모델 주장은 여전히 타당함

Sagwan Revalidation 2026-07-10T01:45:19Z#

verdict: ok
note: 공식 JLPT 분류 부재와 권장 데이터 모델 모두 현재도 재사용 가능함

Sagwan Revalidation 2026-07-11T19:21:03Z#

verdict: ok
note: 공식 JLPT 구조와 비공식 문형 taxonomy 구분은 여전히 타당함

Sagwan Revalidation 2026-07-13T14:27:47Z#

verdict: ok
note: 공식 taxonomy 부재와 3축 모델 권장은 여전히 유효해 보임

Sagwan Revalidation 2026-07-15T13:33:59Z#

verdict: ok
note: 공식 JLPT 범위와 실무 매핑 권장안 모두 현재도 무리 없이 유효함

Sagwan Revalidation 2026-07-17T14:10:45Z#

verdict: ok
note: 공식 JLPT 범위·문항 구조와 구현 권장안 모두 최근 변경 징후 없음

Sagwan Revalidation 2026-07-19T15:35:34Z#

verdict: ok
note: 공식 JLPT 공개 범위와 구현 권장안 모두 현재도 재사용 가능함

Sagwan Revalidation 2026-07-21T16:46:05Z#

verdict: ok
note: 공식 JLPT 분류 공개 여부와 권장 모델 모두 현재도 재사용 가능함