{"info":{"_postman_id":"402261b8-5312-485b-a21b-55a8730d2b1a","name":"NLP","schema":"https://schema.getpostman.com/json/collection/v2.0.0/collection.json","toc":[],"description":"<html><head></head><body></body></html>","owner":"29449333","collectionId":"402261b8-5312-485b-a21b-55a8730d2b1a","publishedId":"2s9Y5creuV","public":true,"customColor":{"top-bar":"FFFFFF","right-sidebar":"303030","highlight":"FF6C37"},"publishDate":"2023-08-31T15:37:15.000Z"},"item":[{"name":"Thai Character Clustering (TCC)","id":"4dae4d54-75af-4b38-bd48-07e6ab757445","protocolProfileBehavior":{"disableBodyPruning":true},"request":{"method":"POST","header":[],"body":{"mode":"raw","raw":"{\n    \"message\":\n    \"เก็บตกมวยคู่พิเศษที่ได้รับความสนใจไปทั่วโลก ระหว่าง บัวขาว บัญชาเมฆ ตำนานกำปั้นจอมเก๋า กับ โคตะ มิอุระ ดาวรุ่งรูปหล่อ ในศึก KAT Presents Legend of Rajadamnern : Kickboxing Exhibition ที่เวทีมวยราชดำเนิน เมื่อช่วงค่ำของวันศุกร์ที่ 19 สิงหาคมที่ผ่านมาโดยอย่างที่ทราบกันว่า ยอดมวยไทยวัย 40 ปี ไล่ถลุง นักสู้ MMA ชาวญี่ปุ่น วัย 20 ปี ด้วยกติกาคิกบ็อกซิ่ง ปิดเกมไปแบบไม่ครบยก หลังกรรมการบนเวทียุติการแข่งขันในช่วงปลายยกที่ 3 เพื่อความปลอดภัยของ โคตะ ที่รับมือพายุอาวุธจาก บัวขาว ไม่ไหวนั่นเอง\"\n}","options":{"raw":{"language":"json"}}},"url":"https://apigw.vizdata.tech/tcc","description":"<h1 id=\"thai-character-cluster-tcc\"><strong>Thai Character Cluster (TCC)</strong></h1>\n<p>TCC is the smallest stand-alone character unit by the spelling rules. By recognizing the Thai character string in the unit of character cluster, it can reduce the size of search space for possible word segmentation positions. Since there is no ambiguity in identifying the character cluster boundary, applying the TCC algorithm will not affect the accuracy in the higher level language processing.</p>\n<p>Response example:</p>\n<p>{<br />\"status\": \"ok\",<br />\"result\": \"ท|ด|ส|อ|บ\"<br />}</p>\n","urlObject":{"protocol":"https","path":["tcc"],"host":["apigw","vizdata","tech"],"query":[],"variable":[]}},"response":[],"_postman_id":"4dae4d54-75af-4b38-bd48-07e6ab757445"},{"name":"Named Entity Recognition (NER)","id":"e5a8d604-7f66-4002-9ea9-cb5e369fa855","protocolProfileBehavior":{"disableBodyPruning":true},"request":{"method":"POST","header":[],"body":{"mode":"raw","raw":"{\n    \"message\":\n    \"เก็บตกมวยคู่พิเศษที่ได้รับความสนใจไปทั่วโลก ระหว่าง บัวขาว บัญชาเมฆ ตำนานกำปั้นจอมเก๋า กับ โคตะ มิอุระ ดาวรุ่งรูปหล่อ ในศึก KAT Presents Legend of Rajadamnern : Kickboxing Exhibition ที่เวทีมวยราชดำเนิน เมื่อช่วงค่ำของวันศุกร์ที่ 19 สิงหาคมที่ผ่านมาโดยอย่างที่ทราบกันว่า ยอดมวยไทยวัย 40 ปี ไล่ถลุง นักสู้ MMA ชาวญี่ปุ่น วัย 20 ปี ด้วยกติกาคิกบ็อกซิ่ง ปิดเกมไปแบบไม่ครบยก หลังกรรมการบนเวทียุติการแข่งขันในช่วงปลายยกที่ 3 เพื่อความปลอดภัยของ โคตะ ที่รับมือพายุอาวุธจาก บัวขาว ไม่ไหวนั่นเอง \"\n}","options":{"raw":{"language":"json"}}},"url":"https://apigw.vizdata.tech/ner","description":"<h1 id=\"named-entity-recognition-ner-for-thai\"><strong>Named Entity Recognition (NER) for Thai</strong></h1>\n<p>Thai Named Entity Tagged Corpus Annotation Scheme and Self Verification. The 9th Language and Technology Conference (LTC2019).</p>\n<p>This corpus is designed and constructed based on the annotation scheme proposed in ORCHID corpus construction, which is the first open online Thai POS Tagged corpus. The corpus is disjointedly managed in seven types of entities: DATe, LOCation, MEAsurement, NAMe, ORGanization, PERson, TIMe, where each category is abbreviated by its first three characters and one another category (Other). The BIO annotation scheme is used for this corpus.</p>\n<p>BIO annotation scheme:</p>\n<p>    B - The beginning of a word</p>\n<p>    I - The inside of a word</p>\n<p>    O - The word does not belong to any type of entities</p>\n<p>Response example:</p>\n<p>{<br />\"status\": \"ok\",<br />\"result\": \"ทดสอบ [O]\"<br />}</p>\n","urlObject":{"protocol":"https","path":["ner"],"host":["apigw","vizdata","tech"],"query":[],"variable":[]}},"response":[],"_postman_id":"e5a8d604-7f66-4002-9ea9-cb5e369fa855"},{"name":"Word Segmentation (WS)","id":"7473d1d5-0264-4ec7-8352-79655b22236a","protocolProfileBehavior":{"disableBodyPruning":true},"request":{"method":"POST","header":[],"body":{"mode":"raw","raw":"{\n    \"message\":\n    \"เก็บตกมวยคู่พิเศษที่ได้รับความสนใจไปทั่วโลก ระหว่าง บัวขาว บัญชาเมฆ ตำนานกำปั้นจอมเก๋า กับ โคตะ มิอุระ ดาวรุ่งรูปหล่อ ในศึก KAT Presents Legend of Rajadamnern : Kickboxing Exhibition ที่เวทีมวยราชดำเนิน เมื่อช่วงค่ำของวันศุกร์ที่ 19 สิงหาคมที่ผ่านมาโดยอย่างที่ทราบกันว่า ยอดมวยไทยวัย 40 ปี ไล่ถลุง นักสู้ MMA ชาวญี่ปุ่น วัย 20 ปี ด้วยกติกาคิกบ็อกซิ่ง ปิดเกมไปแบบไม่ครบยก หลังกรรมการบนเวทียุติการแข่งขันในช่วงปลายยกที่ 3 เพื่อความปลอดภัยของ โคตะ ที่รับมือพายุอาวุธจาก บัวขาว ไม่ไหวนั่นเอง \"\n}","options":{"raw":{"language":"json"}}},"url":"https://apigw.vizdata.tech/wordpos_tokenize","description":"<h1 id=\"word-segmentation-ws\">Word Segmentation <strong>(WS)</strong></h1>\n<p>WS is the word tokenization of thai words with the HMM model and Viterbi algorithm for computing possibilities of possible words with their POS tags. The input of this model is words. The output is the tokenized words with their POS tags.</p>\n<p>Response example:</p>\n<p>{</p>\n<p>\"status\": \"ok\",</p>\n<p>\"result\": \"ทดสอบ/VACT\"</p>\n<p>}</p>\n","urlObject":{"protocol":"https","path":["wordpos_tokenize"],"host":["apigw","vizdata","tech"],"query":[],"variable":[]}},"response":[],"_postman_id":"7473d1d5-0264-4ec7-8352-79655b22236a"},{"name":"Sentence Segmentation (SS)","id":"41bbf2b8-5701-4223-a5b3-b764a290596f","protocolProfileBehavior":{"disableBodyPruning":true},"request":{"method":"POST","header":[],"body":{"mode":"formdata","formdata":[{"key":"text","value":"เก็บตกมวยคู่พิเศษที่ได้รับความสนใจไปทั่วโลก ระหว่าง บัวขาว บัญชาเมฆ ตำนานกำปั้นจอมเก๋า กับ โคตะ มิอุระ ดาวรุ่งรูปหล่อ ในศึก KAT Presents Legend of Rajadamnern : Kickboxing Exhibition ที่เวทีมวยราชดำเนิน เมื่อช่วงค่ำของวันศุกร์ที่ 19 สิงหาคมที่ผ่านมาโดยอย่างที่ทราบกันว่า ยอดมวยไทยวัย 40 ปี ไล่ถลุง นักสู้ MMA ชาวญี่ปุ่น วัย 20 ปี ด้วยกติกาคิกบ็อกซิ่ง ปิดเกมไปแบบไม่ครบยก หลังกรรมการบนเวทียุติการแข่งขันในช่วงปลายยกที่ 3 เพื่อความปลอดภัยของ โคตะ ที่รับมือพายุอาวุธจาก บัวขาว ไม่ไหวนั่นเอง","type":"text"}]},"url":"https://apigw.vizdata.tech/cut_sent","description":"<h1 id=\"sentence-segmentation-ss\">Sentence Segmentation <strong>(SS)</strong></h1>\n<p>SS is our standard tool for dividing bunches of words into sentences for post processing such as sentence classification. The input of this model is words along with their POS tags.</p>\n<p>Response example:<br />{<br />\"sentences\": [\"ทดสอบ\"]<br />}</p>\n","urlObject":{"protocol":"https","path":["cut_sent"],"host":["apigw","vizdata","tech"],"query":[],"variable":[]}},"response":[],"_postman_id":"41bbf2b8-5701-4223-a5b3-b764a290596f"}]}