javascript / intermediate
Snippet
Gebietsschemaspezifische Textsegmentierung
Die Intl.Segmenter-API ermöglicht eine linguistisch korrekte Textaufteilung. Im Gegensatz zu split(' ') versteht sie die Sprachregeln für Wortgrenzen, Satzzeichen und Emojis über verschiedene Gebietsschemata hinweg.
snippet.js
1
2
3
4
5
6
7
const text = "Node.js ist super! 🚀";const segmenter = new Intl.Segmenter('de', { granularity: 'word' });const segments = segmenter.segment(text);for (const { segment, isWordLike } of segments) {if (isWordLike) console.log(`Word: ${segment}`);}
nodejs
Erklärung
1
new Intl.Segmenter('de', { granularity: 'word' });
Initialisiert einen Segmenter für Deutsch, der sich auf Wortebenen-Grenzen konzentriert.
2
isWordLike
Eine boolesche Eigenschaft, die angibt, ob das Segment ein tatsächliches Wort ist (im Gegensatz zu Leerzeichen oder Satzzeichen).