(Top Banner Ad)
ngram
C1
danh từ C1 Ngôn ngữ học, Xử lý ngôn ngữ tự nhiên (NLP), Công nghệ thông tin

ngram

UK: /ˈenˌɡræm/ • US: /ˈenˌɡræm/

Nghĩa tiếng Việt

ngram chuỗi n từ n-gram
Advanced (C1)
(Content Banner Ad)

Definition & Meaning

English Definition

A sequence of n items (typically words) in a text or speech.

Vietnamese Meaning

Một chuỗi gồm n mục (thường là các từ) trong một văn bản hoặc bài phát biểu.

Media Context

Interactive Examples (Tap video to Pause/Play).

Examples

  • "Bigrams are a type of ngram that consist of two words."

    "Bigram là một loại ngram bao gồm hai từ."

  • "We used an ngram model to predict the next word in the sentence."

    "Chúng tôi đã sử dụng một mô hình ngram để dự đoán từ tiếp theo trong câu."

  • "Ngram analysis is a common technique in text mining."

    "Phân tích ngram là một kỹ thuật phổ biến trong khai thác văn bản."

Word Family (Họ từ)

POSWordMeaning
Noun unigram Một n-gram mà n=1; một đơn vị duy nhất (thường là một từ hoặc ký tự).
Noun bigram Một n-gram mà n=2; một cặp đơn vị liền kề (ví dụ: hai từ hoặc ký tự).
Noun trigram Một n-gram mà n=3; một chuỗi ba đơn vị liền kề.
Noun quadrigram Một n-gram mà n=4; một chuỗi bốn đơn vị liền kề.
Noun n-gram analysis Sự phân tích n-gram; quá trình nghiên cứu các chuỗi n phần tử trong dữ liệu văn bản hoặc giọng nói.

Related Words

Subject Area

Ngôn ngữ học, Xử lý ngôn ngữ tự nhiên (NLP), Công nghệ thông tin

Etymology (Nguồn gốc)

English
n-
Ancient Greek
γράμμα (gramma) → English 'gram'
Modern English
ngram

Nguồn gốc của 'ngram'

Từ 'ngram' không có nguồn gốc cổ xưa mà là một thuật ngữ kỹ thuật hiện đại. Nó là sự kết hợp của tiền tố 'n-' (lấy từ toán học, đại diện cho một số nguyên bất kỳ chưa xác định, như 'n-th degree' - bậc n) và 'gram'. 'Gram' ở đây không phải là đơn vị đo trọng lượng mà xuất phát từ tiếng Hy Lạp 'gramma', có nghĩa là 'một chữ cái' hoặc 'thứ gì đó được viết/vẽ'. Do đó, 'ngram' có nghĩa là 'một chuỗi n phần tử được viết hoặc nói'.

Usage Note

Trong xử lý ngôn ngữ tự nhiên (NLP), ngram được sử dụng để phân tích thống kê các chuỗi từ. 'n' có thể là bất kỳ số nguyên dương nào. Ví dụ, unigram (n=1), bigram (n=2), trigram (n=3). Việc sử dụng ngram giúp dự đoán từ tiếp theo, sửa lỗi chính tả, và nhiều ứng dụng khác.

Prepositions

in of for

in: Đề cập đến việc ngram xuất hiện trong một ngữ cảnh lớn hơn (ví dụ: 'ngram in a corpus'). of: Mô tả thành phần của ngram (ví dụ: 'ngram of words'). for: Chỉ mục đích sử dụng của ngram (ví dụ: 'ngram for text analysis').

Collocations (Từ đi kèm)

Adjective + ngram
  • common common n-gram
    (n-gram phổ biến)
  • frequent frequent n-gram
    (n-gram thường xuyên)
  • statistical statistical n-gram
    (n-gram thống kê)
  • language language n-gram
    (n-gram ngôn ngữ)
Verb + ngram
  • generate generate n-grams
    (tạo ra các n-gram)
  • extract extract n-grams
    (trích xuất các n-gram)
  • use use n-grams
    (sử dụng các n-gram)
  • model with model with n-grams
    (mô hình hóa bằng n-gram)
Noun + ngram
  • n-gram n-gram model
    (mô hình n-gram)
  • n-gram n-gram frequency
    (tần suất n-gram)
  • n-gram n-gram distribution
    (phân bố n-gram)

Idioms

  • n-gram model

    Mô hình n-gram; một mô hình ngôn ngữ dựa trên khả năng xuất hiện của chuỗi n phần tử (thường là từ) trong một văn bản.

    "The speech recognition system uses an n-gram model to predict the next word."

    (Hệ thống nhận dạng giọng nói sử dụng mô hình n-gram để dự đoán từ tiếp theo.)

  • n-gram analysis

    Phân tích n-gram; quá trình sử dụng các n-gram để phân tích cấu trúc, phong cách, hoặc đặc điểm của văn bản.

    "N-gram analysis can reveal patterns in text data, such as authorship or topic."

    (Phân tích n-gram có thể tiết lộ các mẫu trong dữ liệu văn bản, chẳng hạn như tác giả hoặc chủ đề.)

  • compute n-gram frequencies

    Tính toán tần suất n-gram; xác định số lần mỗi n-gram xuất hiện trong một tập dữ liệu văn bản.

    "We need to compute n-gram frequencies to build a statistical language model."

    (Chúng ta cần tính toán tần suất n-gram để xây dựng một mô hình ngôn ngữ thống kê.)

Interactive Flashcard

Click the card to flip and test your memory.

ngram

danh từ
Lật mặt

Một chuỗi gồm n mục (thường là các từ) trong một văn bản hoặc bài phát biểu.

"Bigrams are a type of ngram that consist of two words."

Nghe phát âm

Grammar Rules

Rule: Zero Conditional (Câu Điều kiện Loại 0)

Loại câu Ví dụ Tiếng Anh Bản dịch Tiếng Việt
Khẳng định
If you analyze a large text corpus, you often find common ngrams that represent frequently used phrases.
Nếu bạn phân tích một tập hợp văn bản lớn, bạn thường thấy các ngram phổ biến đại diện cho các cụm từ được sử dụng thường xuyên.
Phủ định
If the dataset is small, the ngram analysis doesn't usually provide statistically significant results.
Nếu tập dữ liệu nhỏ, phân tích ngram thường không cung cấp kết quả có ý nghĩa thống kê.
Nghi vấn
If you increase the 'n' in an ngram, does the computational cost increase significantly?
Nếu bạn tăng 'n' trong một ngram, chi phí tính toán có tăng lên đáng kể không?

Cultural Context

Khám phá các khía cạnh văn hóa và xã hội thú vị xoay quanh từ "ngram".

Ứng dụng rộng rãi trong công nghệ

Mặc dù 'ngram' là một thuật ngữ kỹ thuật, nó là nền tảng cho nhiều công nghệ mà chúng ta sử dụng hàng ngày. Ví dụ, tính năng tự động sửa lỗi và gợi ý từ trên điện thoại di động của bạn, các công cụ dịch thuật như Google Translate, hay cả cách các công cụ tìm kiếm xếp hạng kết quả đều được hỗ trợ bởi các mô hình n-gram phức tạp. Chúng giúp máy tính 'hiểu' được ngữ cảnh và xác suất của các từ hoặc ký tự xuất hiện cùng nhau.

Phát hiện đạo văn và phân tích tác giả

N-gram cũng có ứng dụng quan trọng trong việc phân tích văn bản để phát hiện đạo văn hoặc xác định tác giả của một tài liệu. Bằng cách so sánh tần suất và mẫu n-gram độc đáo trong các văn bản khác nhau, các nhà nghiên cứu có thể tìm ra sự trùng lặp hoặc những đặc điểm viết riêng biệt, từ đó hỗ trợ trong các lĩnh vực pháp y ngôn ngữ và nghiên cứu học thuật.