feat: source frequency ranks from installed Yomitan dictionaries

2026-03-01 06:22:44 -08:00 · 2026-02-28 03:47:57 -08:00
parent d24283e82d
commit a9f7ea0204
21 changed files with 448 additions and 55 deletions
--- a/README.md
+++ b/README.md
@@ -27,7 +27,7 @@ SubMiner is an Electron overlay that sits on top of mpv. It turns your video pla
 - **Hover to look up** — Yomitan dictionary popups directly on subtitles
 - **One-key mining** — Creates Anki cards with sentence, audio, screenshot, and translation
 - **Instant auto-enrichment** — Optional local AnkiConnect proxy enriches new Yomitan cards immediately
- **N+1 highlighting** — Marks known words from your Anki deck so unknown ones jump out
+- **Reading annotations** — Combines N+1 targeting, frequency-dictionary highlighting, and JLPT underlining while you read
 - **Subtitle tools** — Download from Jimaku, sync with alass/ffsubsync
 - **Immersion tracking** — SQLite-powered stats on your watch time and mining activity
 - **Custom texthooker page** — Built-in custom texthooker page and websocket, no extra setup
--- a/config.example.jsonc
+++ b/config.example.jsonc
@@ -133,7 +133,7 @@
    }, // Jlpt colors setting.
    "frequencyDictionary": {
      "enabled": false, // Enable frequency-dictionary-based highlighting based on token rank. Values: true | false
-      "sourcePath": "", // Optional absolute path to a frequency dictionary directory. If empty, built-in discovery search paths are used.
+      "sourcePath": "", // Optional absolute path to a frequency dictionary directory. If empty, SubMiner searches installed/default frequency-dictionary locations.
      "topX": 1000, // Only color tokens with frequency rank <= topX (default: 1000).
      "mode": "single", // single: use one color for all matching tokens. banded: use color ramp by frequency band. Values: single | banded
      "singleColor": "#f5a97f", // Color used when frequencyDictionary.mode is `single`.
--- a/docs/configuration.md
+++ b/docs/configuration.md
@@ -757,7 +757,7 @@ See `config.example.jsonc` for detailed configuration options.
 | `enableJlpt`                       | boolean     | Enable JLPT level underline styling (`false` by default)                                                            |
 | `preserveLineBreaks`               | boolean     | Preserve line breaks in visible overlay subtitle rendering (`false` by default). Enable to mirror mpv line layout.  |
 | `frequencyDictionary.enabled`      | boolean     | Enable frequency highlighting from dictionary lookups (`false` by default)                                          |
-| `frequencyDictionary.sourcePath`   | string      | Path to a local frequency dictionary root. Leave empty or omit to use the built-in bundled dictionary search paths. |
+| `frequencyDictionary.sourcePath`   | string      | Path to a local frequency dictionary root. Leave empty or omit to use installed/default frequency-dictionary search paths. |
 | `frequencyDictionary.topX`         | number      | Only color tokens whose frequency rank is `<= topX` (`1000` by default)                                             |
 | `frequencyDictionary.mode`         | string      | `"single"` or `"banded"` (`"single"` by default)                                                                    |
 | `frequencyDictionary.singleColor`  | string      | Color used for all highlighted tokens in single mode                                                                |
@@ -774,7 +774,7 @@ Frequency dictionary highlighting uses the same dictionary file format as JLPT b
 Lookup behavior:
 - Set `frequencyDictionary.sourcePath` to a directory containing `term_meta_bank_*.json` for a fully custom source.
- If `sourcePath` is missing or empty, SubMiner uses bundled defaults from `vendor/jiten_freq_global` (packaged under `<resources>/jiten_freq_global` in distribution builds).
+- If `sourcePath` is missing or empty, SubMiner searches default install/runtime locations for `frequency-dictionary` directories (for example app resources, user data paths, and current working directory).
 - In both cases, only terms with a valid `frequencyRank` are used; everything else falls back to no highlighting.
 In `single` mode all highlights use `singleColor`; in `banded` mode tokens map to five ascending color bands from most common to least common inside the topX window.
--- a/docs/index.md
+++ b/docs/index.md
@@ -7,7 +7,7 @@ titleTemplate: Immersion Mining Workflow for MPV
 hero:
  name: SubMiner
  text: Immersion Mining for MPV
-  tagline: Watch media, mine vocabulary, and build cards without leaving the scene.
+  tagline: Watch media, mine vocabulary, and craft anki cards without leaving the scene.
  image:
    src: /assets/SubMiner.png
    alt: SubMiner logo
@@ -35,16 +35,11 @@ features:
      alt: Anki card icon
    title: Anki Card Enrichment
    details: Auto-fills card fields with subtitle sentence, clipping, image, and translation so you can focus on learning.
  - icon:
      src: /assets/dual-layer.svg
      alt: Dual layer icon
    title: Unified Overlay Stack
    details: Primary interactive subtitle layer with a built-in secondary context bar, all in one overlay window.
  - icon:
      src: /assets/highlight.svg
      alt: Highlight icon
-    title: N+1 Highlighting
+    title: Reading Annotations
-    details: Surfaces known words from your deck so unknown targets stand out during immersion sessions.
+    details: Combines N+1 targeting, Jiten frequency highlighting, and JLPT tagging so useful cues stay visible while you read.
  - icon:
      src: /assets/tokenization.svg
      alt: Tokenization icon
@@ -55,16 +50,6 @@ features:
      alt: Subtitle download icon
    title: Subtitle Download & Sync
    details: Pull and synchronize subtitles with Jimaku plus alass/ffsubsync in one cohesive workflow.
  - icon:
      src: /assets/keyboard.svg
      alt: Keyboard icon
    title: Keyboard-Driven
    details: Run lookups, mining actions, clipping, and workflow toggles with one configurable shortcut surface.
  - icon:
      src: /assets/texthooker.svg
      alt: Texthooker icon
    title: Texthooker & WebSocket
    details: Stream subtitles in real time to browser tools via local WebSocket and keep your stack integrated.
 ---
 <script setup>
--- a/docs/jlpt-vocab-bundle.md
+++ b/docs/jlpt-vocab-bundle.md
@@ -26,7 +26,7 @@ The expected files are:
 Each bank maps terms to frequency metadata; only entries with a `frequency.displayValue` are considered for JLPT tagging.
-SubMiner also reuses the same `term_meta_bank_*.json` format for frequency-based subtitle highlighting. The default frequency source is now bundled as `vendor/jiten_freq_global`, so users can enable `subtitleStyle.frequencyDictionary` without extra setup.
+SubMiner also reuses the same `term_meta_bank_*.json` format for frequency-based subtitle highlighting, using installed/default `frequency-dictionary` locations or an explicit `subtitleStyle.frequencyDictionary.sourcePath`.
 ## Source and update process
--- a/docs/public/config.example.jsonc
+++ b/docs/public/config.example.jsonc
@@ -133,7 +133,7 @@
    }, // Jlpt colors setting.
    "frequencyDictionary": {
      "enabled": false, // Enable frequency-dictionary-based highlighting based on token rank. Values: true | false
-      "sourcePath": "", // Optional absolute path to a frequency dictionary directory. If empty, built-in discovery search paths are used.
+      "sourcePath": "", // Optional absolute path to a frequency dictionary directory. If empty, SubMiner searches installed/default frequency-dictionary locations.
      "topX": 1000, // Only color tokens with frequency rank <= topX (default: 1000).
      "mode": "single", // single: use one color for all matching tokens. banded: use color ramp by frequency band. Values: single | banded
      "singleColor": "#f5a97f", // Color used when frequencyDictionary.mode is `single`.
--- a/package.json
+++ b/package.json
@@ -119,10 +119,6 @@
        "from": "vendor/yomitan-jlpt-vocab",
        "to": "yomitan-jlpt-vocab"
      },
      {
        "from": "vendor/jiten_freq_global",
        "to": "jiten_freq_global"
      },
      {
        "from": "assets",
        "to": "assets"
--- a/scripts/get_frequency.ts
+++ b/scripts/get_frequency.ts
@@ -33,7 +33,7 @@ interface CliOptions {
 function parseCliArgs(argv: string[]): CliOptions {
  const args = [...argv];
  let inputParts: string[] = [];
-  let dictionaryPath = path.join(process.cwd(), 'vendor', 'jiten_freq_global');
+  let dictionaryPath = path.join(process.cwd(), 'vendor', 'frequency-dictionary');
  let emitPretty = false;
  let emitDiagnostics = false;
  let mecabCommand: string | undefined;
@@ -394,7 +394,7 @@ function printUsage(): void {
  --color-band-5 <#hex>  Frequency band-5 color.
  --color-known <#hex>    Known-word color (default: #a6da95).
  --color-n-plus-one <#hex> N+1 target color (default: #c6a0f6).
-  --dictionary <path>    Frequency dictionary root path (default: ./vendor/jiten_freq_global)
+  --dictionary <path>    Frequency dictionary root path (default: ./vendor/frequency-dictionary)
  --mecab-command <path>  Optional MeCab binary path (default: mecab)
  --mecab-dictionary <path> Optional MeCab dictionary directory (default: system default)
  -h, --help            Show usage.
--- a/src/core/services/frequency-dictionary.test.ts
+++ b/src/core/services/frequency-dictionary.test.ts
@@ -79,3 +79,30 @@ test('createFrequencyDictionaryLookup aggregates duplicate-term logs into a sing
    false,
  );
 });
 test('createFrequencyDictionaryLookup prefers frequency.value over displayValue', async () => {
  const logs: string[] = [];
  const tempDir = fs.mkdtempSync(path.join(os.tmpdir(), 'subminer-frequency-dict-'));
  const bankPath = path.join(tempDir, 'term_meta_bank_1.json');
  fs.writeFileSync(
    bankPath,
    JSON.stringify([
      ['猫', 1, { frequency: { value: 1234, displayValue: 1200 } }],
      ['犬', 2, { frequency: { displayValue: 88 } }],
    ]),
  );
  const lookup = await createFrequencyDictionaryLookup({
    searchPaths: [tempDir],
    log: (message) => {
      logs.push(message);
    },
  });
  assert.equal(lookup('猫'), 1234);
  assert.equal(lookup('犬'), 88);
  assert.equal(
    logs.some((entry) => entry.includes('Frequency dictionary loaded from')),
    true,
  );
 });
--- a/src/core/services/frequency-dictionary.ts
+++ b/src/core/services/frequency-dictionary.ts
@@ -18,17 +18,14 @@ function normalizeFrequencyTerm(value: string): string {
  return value.trim().toLowerCase();
 }
-function extractFrequencyDisplayValue(meta: unknown): number | null {
+function parsePositiveFrequencyNumber(value: unknown): number | null {
-  if (!meta || typeof meta !== 'object') return null;
+  if (typeof value === 'number') {
-  const frequency = (meta as { frequency?: unknown }).frequency;
+    if (!Number.isFinite(value) || value <= 0) return null;
-  if (!frequency || typeof frequency !== 'object') return null;
+    return Math.floor(value);
  const displayValue = (frequency as { displayValue?: unknown }).displayValue;
  if (typeof displayValue === 'number') {
    if (!Number.isFinite(displayValue) || displayValue <= 0) return null;
    return Math.floor(displayValue);
  }
-  if (typeof displayValue === 'string') {
+
-    const normalized = displayValue.trim().replace(/,/g, '');
+  if (typeof value === 'string') {
    const normalized = value.trim().replace(/,/g, '');
    const parsed = Number.parseInt(normalized, 10);
    if (!Number.isFinite(parsed) || parsed <= 0) return null;
    return parsed;
@@ -37,6 +34,20 @@ function extractFrequencyDisplayValue(meta: unknown): number | null {
  return null;
 }
 function extractFrequencyDisplayValue(meta: unknown): number | null {
  if (!meta || typeof meta !== 'object') return null;
  const frequency = (meta as { frequency?: unknown }).frequency;
  if (!frequency || typeof frequency !== 'object') return null;
  const rawValue = (frequency as { value?: unknown }).value;
  const parsedValue = parsePositiveFrequencyNumber(rawValue);
  if (parsedValue !== null) {
    return parsedValue;
  }
  const displayValue = (frequency as { displayValue?: unknown }).displayValue;
  return parsePositiveFrequencyNumber(displayValue);
 }
 function asFrequencyDictionaryEntry(entry: unknown): FrequencyDictionaryEntry | null {
  if (!Array.isArray(entry) || entry.length < 3) {
    return null;
--- a/src/core/services/tokenizer.test.ts
+++ b/src/core/services/tokenizer.test.ts
@@ -169,6 +169,55 @@ test('tokenizeSubtitle applies frequency dictionary ranks', async () => {
  assert.equal(result.tokens?.[1]?.frequencyRank, 1200);
 });
 test('tokenizeSubtitle loads frequency ranks from Yomitan installed dictionaries', async () => {
  const result = await tokenizeSubtitle(
    '猫',
    makeDeps({
      getFrequencyDictionaryEnabled: () => true,
      getYomitanExt: () => ({ id: 'dummy-ext' }) as any,
      getYomitanParserWindow: () =>
        ({
          isDestroyed: () => false,
          webContents: {
            executeJavaScript: async (script: string) => {
              if (script.includes('getTermFrequencies')) {
                return [
                  {
                    term: '猫',
                    reading: 'ねこ',
                    dictionary: 'freq-dict',
                    frequency: 77,
                    displayValue: '77',
                    displayValueParsed: true,
                  },
                ];
              }
              return [
                {
                  source: 'scanning-parser',
                  index: 0,
                  content: [
                    [
                      {
                        text: '猫',
                        reading: 'ねこ',
                        headwords: [[{ term: '猫' }]],
                      },
                    ],
                  ],
                },
              ];
            },
          },
        }) as unknown as Electron.BrowserWindow,
    }),
  );
  assert.equal(result.tokens?.length, 1);
  assert.equal(result.tokens?.[0]?.frequencyRank, 77);
 });
 test('tokenizeSubtitle uses only selected Yomitan headword for frequency lookup', async () => {
  const result = await tokenizeSubtitle(
    '猫です',
--- a/src/core/services/tokenizer.ts
+++ b/src/core/services/tokenizer.ts
@@ -10,7 +10,10 @@ import {
  JlptLevel,
 } from '../../types';
 import { selectYomitanParseTokens } from './tokenizer/parser-selection-stage';
-import { requestYomitanParseResults } from './tokenizer/yomitan-parser-runtime';
+import {
  requestYomitanParseResults,
  requestYomitanTermFrequencies,
 } from './tokenizer/yomitan-parser-runtime';
 const logger = createLogger('main:tokenizer');
@@ -214,6 +217,64 @@ function logSelectedYomitanGroups(text: string, tokens: MergedToken[]): void {
  });
 }
 function normalizePositiveFrequencyRank(value: unknown): number | null {
  if (typeof value !== 'number' || !Number.isFinite(value) || value <= 0) {
    return null;
  }
  return Math.max(1, Math.floor(value));
 }
 function resolveFrequencyLookupText(token: MergedToken): string {
  if (token.headword && token.headword.length > 0) {
    return token.headword;
  }
  if (token.reading && token.reading.length > 0) {
    return token.reading;
  }
  return token.surface;
 }
 function applyYomitanFrequencyRanks(
  tokens: MergedToken[],
  frequencies: ReadonlyArray<{ term: string; frequency: number }>,
 ): MergedToken[] {
  if (tokens.length === 0 || frequencies.length === 0) {
    return tokens;
  }
  const rankByTerm = new Map<string, number>();
  for (const frequency of frequencies) {
    const normalizedTerm = frequency.term.trim();
    const rank = normalizePositiveFrequencyRank(frequency.frequency);
    if (!normalizedTerm || rank === null) {
      continue;
    }
    const current = rankByTerm.get(normalizedTerm);
    if (current === undefined || rank < current) {
      rankByTerm.set(normalizedTerm, rank);
    }
  }
  if (rankByTerm.size === 0) {
    return tokens;
  }
  return tokens.map((token) => {
    const lookupText = resolveFrequencyLookupText(token).trim();
    if (!lookupText) {
      return token;
    }
    const rank = rankByTerm.get(lookupText);
    if (rank === undefined) {
      return token;
    }
    return {
      ...token,
      frequencyRank: rank,
    };
  });
 }
 function getAnnotationOptions(deps: TokenizerServiceDeps): TokenizerAnnotationOptions {
  return {
    nPlusOneEnabled: deps.getNPlusOneEnabled?.() !== false,
@@ -246,14 +307,24 @@ async function parseWithYomitanInternalParser(
    logSelectedYomitanGroups(text, selectedTokens);
  }
  let tokensWithFrequency = selectedTokens;
  if (options.frequencyEnabled) {
    const termReadingList = selectedTokens.map((token) => ({
      term: resolveFrequencyLookupText(token),
      reading: token.reading && token.reading.trim().length > 0 ? token.reading.trim() : null,
    }));
    const yomitanFrequencies = await requestYomitanTermFrequencies(termReadingList, deps, logger);
    tokensWithFrequency = applyYomitanFrequencyRanks(selectedTokens, yomitanFrequencies);
  }
  if (!needsMecabPosEnrichment(options)) {
-    return selectedTokens;
+    return tokensWithFrequency;
  }
  try {
    const mecabTokens = await deps.tokenizeWithMecab(text);
    const enrichTokensWithMecab = deps.enrichTokensWithMecab ?? enrichTokensWithMecabAsync;
-    return await enrichTokensWithMecab(selectedTokens, mecabTokens);
+    return await enrichTokensWithMecab(tokensWithFrequency, mecabTokens);
  } catch (err) {
    const error = err as Error;
    logger.warn(
@@ -262,7 +333,7 @@ async function parseWithYomitanInternalParser(
      `tokenCount=${selectedTokens.length}`,
      `textLength=${text.length}`,
    );
-    return selectedTokens;
+    return tokensWithFrequency;
  }
 }
--- a/src/core/services/tokenizer/annotation-stage.test.ts
+++ b/src/core/services/tokenizer/annotation-stage.test.ts
@@ -95,6 +95,27 @@ test('annotateTokens excludes frequency for particle/bound_auxiliary and pos1 ex
  assert.deepEqual(lookupCalls, ['猫']);
 });
 test('annotateTokens preserves existing frequency rank when lookup is unavailable', () => {
  const tokens = [makeToken({ surface: '猫', headword: '猫', frequencyRank: 42 })];
  const result = annotateTokens(tokens, makeDeps({ getFrequencyRank: undefined }));
  assert.equal(result[0]?.frequencyRank, 42);
 });
 test('annotateTokens prefers existing frequency rank over fallback lookup', () => {
  const tokens = [makeToken({ surface: '猫', headword: '猫', frequencyRank: 42 })];
  const result = annotateTokens(
    tokens,
    makeDeps({
      getFrequencyRank: () => 9,
    }),
  );
  assert.equal(result[0]?.frequencyRank, 42);
 });
 test('annotateTokens handles JLPT disabled and eligibility exclusion paths', () => {
  let disabledLookupCalls = 0;
  const disabledResult = annotateTokens(
@@ -157,3 +178,38 @@ test('annotateTokens N+1 handoff marks expected target when threshold is satisfi
  assert.equal(result[1]?.isNPlusOneTarget, true);
  assert.equal(result[2]?.isNPlusOneTarget, false);
 });
 test('annotateTokens N+1 minimum sentence words counts only eligible word tokens', () => {
  const tokens = [
    makeToken({ surface: '猫', headword: '猫', startPos: 0, endPos: 1 }),
    makeToken({
      surface: 'が',
      headword: 'が',
      partOfSpeech: PartOfSpeech.particle,
      pos1: '助詞',
      startPos: 1,
      endPos: 2,
    }),
    makeToken({
      surface: 'です',
      headword: 'です',
      partOfSpeech: PartOfSpeech.bound_auxiliary,
      pos1: '助動詞',
      startPos: 2,
      endPos: 4,
    }),
  ];
  const result = annotateTokens(
    tokens,
    makeDeps({
      isKnownWord: (text) => text === 'が' || text === 'です',
    }),
    { minSentenceWordsForNPlusOne: 3 },
  );
  assert.equal(result[0]?.isKnown, false);
  assert.equal(result[1]?.isKnown, true);
  assert.equal(result[2]?.isKnown, true);
  assert.equal(result[0]?.isNPlusOneTarget, false);
 });
--- a/src/core/services/tokenizer/annotation-stage.ts
+++ b/src/core/services/tokenizer/annotation-stage.ts
@@ -141,6 +141,11 @@ function applyFrequencyMarking(
      return { ...token, frequencyRank: undefined };
    }
    if (typeof token.frequencyRank === 'number' && Number.isFinite(token.frequencyRank)) {
      const rank = Math.max(1, Math.floor(token.frequencyRank));
      return { ...token, frequencyRank: rank };
    }
    const lookupTexts = getFrequencyLookupTextCandidates(token);
    if (lookupTexts.length === 0) {
      return { ...token, frequencyRank: undefined };
@@ -354,6 +359,14 @@ export function annotateTokens(
  const frequencyMarkedTokens =
    frequencyEnabled && deps.getFrequencyRank
      ? applyFrequencyMarking(knownMarkedTokens, deps.getFrequencyRank)
      : frequencyEnabled
        ? knownMarkedTokens.map((token) => ({
            ...token,
            frequencyRank:
              typeof token.frequencyRank === 'number' && Number.isFinite(token.frequencyRank)
                ? Math.max(1, Math.floor(token.frequencyRank))
                : undefined,
          }))
      : knownMarkedTokens.map((token) => ({
          ...token,
          frequencyRank: undefined,
--- a/src/core/services/tokenizer/yomitan-parser-runtime.test.ts
+++ b/src/core/services/tokenizer/yomitan-parser-runtime.test.ts
@@ -1,6 +1,9 @@
 import assert from 'node:assert/strict';
 import test from 'node:test';
-import { syncYomitanDefaultAnkiServer } from './yomitan-parser-runtime';
+import {
  requestYomitanTermFrequencies,
  syncYomitanDefaultAnkiServer,
 } from './yomitan-parser-runtime';
 function createDeps(executeJavaScript: (script: string) => Promise<unknown>) {
  const parserWindow = {
@@ -81,3 +84,35 @@ test('syncYomitanDefaultAnkiServer no-ops for empty target url', async () => {
  assert.equal(updated, false);
  assert.equal(executeCount, 0);
 });
 test('requestYomitanTermFrequencies returns normalized frequency entries', async () => {
  let scriptValue = '';
  const deps = createDeps(async (script) => {
    scriptValue = script;
    return [
      {
        term: '猫',
        reading: 'ねこ',
        dictionary: 'freq-dict',
        frequency: 77,
        displayValue: '77',
        displayValueParsed: true,
      },
      {
        term: 'invalid',
        dictionary: 'freq-dict',
        frequency: 0,
      },
    ];
  });
  const result = await requestYomitanTermFrequencies([{ term: '猫', reading: 'ねこ' }], deps, {
    error: () => undefined,
  });
  assert.equal(result.length, 1);
  assert.equal(result[0]?.term, '猫');
  assert.equal(result[0]?.frequency, 77);
  assert.match(scriptValue, /getTermFrequencies/);
  assert.match(scriptValue, /optionsGetFull/);
 });
--- a/src/core/services/tokenizer/yomitan-parser-runtime.ts
+++ b/src/core/services/tokenizer/yomitan-parser-runtime.ts
@@ -15,6 +15,89 @@ interface YomitanParserRuntimeDeps {
  setYomitanParserInitPromise: (promise: Promise<boolean> | null) => void;
 }
 export interface YomitanTermFrequency {
  term: string;
  reading: string | null;
  dictionary: string;
  frequency: number;
  displayValue: string | null;
  displayValueParsed: boolean;
 }
 export interface YomitanTermReadingPair {
  term: string;
  reading: string | null;
 }
 function isObject(value: unknown): value is Record<string, unknown> {
  return Boolean(value && typeof value === 'object');
 }
 function asPositiveInteger(value: unknown): number | null {
  if (typeof value !== 'number' || !Number.isFinite(value) || value <= 0) {
    return null;
  }
  return Math.max(1, Math.floor(value));
 }
 function toYomitanTermFrequency(value: unknown): YomitanTermFrequency | null {
  if (!isObject(value)) {
    return null;
  }
  const term = typeof value.term === 'string' ? value.term.trim() : '';
  const dictionary = typeof value.dictionary === 'string' ? value.dictionary.trim() : '';
  const frequency = asPositiveInteger(value.frequency);
  if (!term || !dictionary || frequency === null) {
    return null;
  }
  const reading =
    value.reading === null
      ? null
      : typeof value.reading === 'string'
        ? value.reading
        : null;
  const displayValue =
    value.displayValue === null
      ? null
      : typeof value.displayValue === 'string'
        ? value.displayValue
        : null;
  const displayValueParsed = value.displayValueParsed === true;
  return {
    term,
    reading,
    dictionary,
    frequency,
    displayValue,
    displayValueParsed,
  };
 }
 function normalizeTermReadingList(termReadingList: YomitanTermReadingPair[]): YomitanTermReadingPair[] {
  const normalized: YomitanTermReadingPair[] = [];
  const seen = new Set<string>();
  for (const pair of termReadingList) {
    const term = typeof pair.term === 'string' ? pair.term.trim() : '';
    if (!term) {
      continue;
    }
    const reading =
      typeof pair.reading === 'string' && pair.reading.trim().length > 0 ? pair.reading.trim() : null;
    const key = `${term}\u0000${reading ?? ''}`;
    if (seen.has(key)) {
      continue;
    }
    seen.add(key);
    normalized.push({ term, reading });
  }
  return normalized;
 }
 async function ensureYomitanParserWindow(
  deps: YomitanParserRuntimeDeps,
  logger: LoggerLike,
@@ -154,6 +237,79 @@ export async function requestYomitanParseResults(
  }
 }
 export async function requestYomitanTermFrequencies(
  termReadingList: YomitanTermReadingPair[],
  deps: YomitanParserRuntimeDeps,
  logger: LoggerLike,
 ): Promise<YomitanTermFrequency[]> {
  const normalizedTermReadingList = normalizeTermReadingList(termReadingList);
  const yomitanExt = deps.getYomitanExt();
  if (normalizedTermReadingList.length === 0 || !yomitanExt) {
    return [];
  }
  const isReady = await ensureYomitanParserWindow(deps, logger);
  const parserWindow = deps.getYomitanParserWindow();
  if (!isReady || !parserWindow || parserWindow.isDestroyed()) {
    return [];
  }
  const script = `
    (async () => {
      const invoke = (action, params) =>
        new Promise((resolve, reject) => {
          chrome.runtime.sendMessage({ action, params }, (response) => {
            if (chrome.runtime.lastError) {
              reject(new Error(chrome.runtime.lastError.message));
              return;
            }
            if (!response || typeof response !== "object") {
              reject(new Error("Invalid response from Yomitan backend"));
              return;
            }
            if (response.error) {
              reject(new Error(response.error.message || "Yomitan backend error"));
              return;
            }
            resolve(response.result);
          });
        });
      const optionsFull = await invoke("optionsGetFull", undefined);
      const profileIndex = optionsFull.profileCurrent;
      const dictionariesRaw = optionsFull.profiles?.[profileIndex]?.options?.dictionaries ?? [];
      const dictionaries = Array.isArray(dictionariesRaw)
        ? dictionariesRaw
            .filter((entry) => entry && typeof entry === "object" && entry.enabled === true && typeof entry.name === "string")
            .map((entry) => entry.name)
        : [];
      if (dictionaries.length === 0) {
        return [];
      }
      return await invoke("getTermFrequencies", {
        termReadingList: ${JSON.stringify(normalizedTermReadingList)},
        dictionaries
      });
    })();
  `;
  try {
    const rawResult = await parserWindow.webContents.executeJavaScript(script, true);
    if (!Array.isArray(rawResult)) {
      return [];
    }
    return rawResult
      .map((entry) => toYomitanTermFrequency(entry))
      .filter((entry): entry is YomitanTermFrequency => entry !== null);
  } catch (err) {
    logger.error('Yomitan term frequency request failed:', (err as Error).message);
    return [];
  }
 }
 export async function syncYomitanDefaultAnkiServer(
  serverUrl: string,
  deps: YomitanParserRuntimeDeps,
--- a/src/main/frequency-dictionary-runtime.ts
+++ b/src/main/frequency-dictionary-runtime.ts
@@ -28,7 +28,7 @@ export function getFrequencyDictionarySearchPaths(
  const rawSearchPaths: string[] = [];
  // User-provided path takes precedence over bundled/default roots.
-  // Root list should include `vendor/jiten_freq_global` in callers.
+  // Root list should include default installed frequency-dictionary locations in callers.
  if (sourcePath && sourcePath.trim()) {
    rawSearchPaths.push(sourcePath.trim());
    rawSearchPaths.push(path.join(sourcePath.trim(), 'frequency-dictionary'));
--- a/src/main/runtime/dictionary-runtime-main-deps.test.ts
+++ b/src/main/runtime/dictionary-runtime-main-deps.test.ts
@@ -53,9 +53,9 @@ test('frequency dictionary roots main handler returns expected root list', () =>
    joinPath: (...parts) => parts.join('/'),
  })();
-  assert.equal(roots.length, 15);
+  assert.equal(roots.length, 11);
-  assert.equal(roots[0], '/repo/dist/main/../../vendor/jiten_freq_global');
+  assert.equal(roots[0], '/repo/dist/main/../../vendor/frequency-dictionary');
-  assert.equal(roots[14], '/repo');
+  assert.equal(roots[10], '/repo');
 });
 test('frequency dictionary runtime main deps builder maps search paths/source and log prefix', () => {
--- a/src/main/runtime/dictionary-runtime-main-deps.ts
+++ b/src/main/runtime/dictionary-runtime-main-deps.ts
@@ -38,13 +38,9 @@ export function createBuildFrequencyDictionaryRootsMainHandler(deps: {
  joinPath: (...parts: string[]) => string;
 }) {
  return () => [
    deps.joinPath(deps.dirname, '..', '..', 'vendor', 'jiten_freq_global'),
    deps.joinPath(deps.dirname, '..', '..', 'vendor', 'frequency-dictionary'),
    deps.joinPath(deps.appPath, 'vendor', 'jiten_freq_global'),
    deps.joinPath(deps.appPath, 'vendor', 'frequency-dictionary'),
    deps.joinPath(deps.resourcesPath, 'jiten_freq_global'),
    deps.joinPath(deps.resourcesPath, 'frequency-dictionary'),
    deps.joinPath(deps.resourcesPath, 'app.asar', 'vendor', 'jiten_freq_global'),
    deps.joinPath(deps.resourcesPath, 'app.asar', 'vendor', 'frequency-dictionary'),
    deps.userDataPath,
    deps.appUserDataPath,
--- a/vendor/jiten_freq_global/index.json
+++ b/vendor/jiten_freq_global/index.json
@@ -1 +0,0 @@
 {"title":"Jiten","format":3,"revision":"Jiten 26-02-16","isUpdatable":true,"indexUrl":"https://api.jiten.moe/api/frequency-list/index","downloadUrl":"https://api.jiten.moe/api/frequency-list/download","sequenced":false,"frequencyMode":"rank-based","author":"Jiten","url":"https://jiten.moe","description":"Dictionary based on frequency data of all media from jiten.moe"}
--- a/vendor/jiten_freq_global/term_meta_bank_1.json
+++ b/vendor/jiten_freq_global/term_meta_bank_1.json
		`@@ -1 +0,0 @@`
			`{"title":"Jiten","format":3,"revision":"Jiten 26-02-16","isUpdatable":true,"indexUrl":"https://api.jiten.moe/api/frequency-list/index","downloadUrl":"https://api.jiten.moe/api/frequency-list/download","sequenced":false,"frequencyMode":"rank-based","author":"Jiten","url":"https://jiten.moe","description":"Dictionary based on frequency data of all media from jiten.moe"}`