(Top Banner Ad)
bigram
C1
danh từ C1 Ngôn ngữ học, Xử lý ngôn ngữ tự nhiên

bigram

UK: /ˈbaɪˌɡræm/ • US: /ˈbaɪˌɡræm/

Nghĩa tiếng Việt

nhị gram cặp gram chuỗi hai phần tử
Advanced (C1)
(Content Banner Ad)

Definition & Meaning

English Definition

A sequence of two adjacent elements from a string of tokens, which are typically letters, syllables, or words.

Vietnamese Meaning

Một chuỗi gồm hai phần tử liền kề từ một chuỗi các token, thường là chữ cái, âm tiết hoặc từ.

Media Context

Interactive Examples (Tap video to Pause/Play).

Examples

  • "Bigram analysis is useful for predicting the next word in a sentence."

    "Phân tích bigram rất hữu ích cho việc dự đoán từ tiếp theo trong một câu."

  • "The bigrams 'th' and 'he' are common in English."

    "Các bigram 'th' và 'he' là phổ biến trong tiếng Anh."

  • "We used bigrams to improve the accuracy of our speech recognition system."

    "Chúng tôi đã sử dụng bigram để cải thiện độ chính xác của hệ thống nhận dạng giọng nói của chúng tôi."

Word Family (Họ từ)

POSWordMeaning
Noun n-gram Một chuỗi gồm n đơn vị (ký tự, từ, v.v.) liền kề trong văn bản.
Noun unigram Một đơn vị duy nhất (một ký tự hoặc một từ).
Noun trigram Một chuỗi gồm ba đơn vị liền kề.
Noun digram Một từ đồng nghĩa của bigram, một cặp hai chữ cái.

Related Words

Subject Area

Ngôn ngữ học, Xử lý ngôn ngữ tự nhiên

Etymology (Nguồn gốc)

Latin
bi-
Greek
gramma
English
bigram

Câu chuyện về 'bi' và 'gram'

Từ 'bigram' là sự kết hợp thú vị của hai ngôn ngữ cổ. Tiền tố 'bi-' đến từ tiếng Latin, có nghĩa là 'hai'. Hậu tố '-gram' bắt nguồn từ từ 'gramma' trong tiếng Hy Lạp, có nghĩa là 'chữ cái' hoặc 'thứ được viết ra'. Vì vậy, 'bigram' theo nghĩa đen có nghĩa là 'hai chữ cái', dùng để chỉ một cặp ký tự hoặc từ đứng liền nhau trong một chuỗi văn bản.

Usage Note

Bigrams được sử dụng rộng rãi trong xử lý ngôn ngữ tự nhiên để phân tích tần suất xuất hiện của các cặp từ hoặc ký tự, giúp xây dựng các mô hình ngôn ngữ và thực hiện các tác vụ như sửa lỗi chính tả, nhận dạng giọng nói và dịch máy. Sự khác biệt chính so với 'unigram' (một token đơn lẻ) và 'trigram' (ba token liền kề) là số lượng token được xem xét trong chuỗi.

Prepositions

in for of

- **in:** Sử dụng để chỉ nơi bigram được tìm thấy (ví dụ: 'Bigrams in this text...'). - **for:** Sử dụng để chỉ mục đích sử dụng bigram (ví dụ: 'Bigrams are used for...'). - **of:** Sử dụng để chỉ thành phần của một tập hợp lớn hơn (ví dụ: 'Analysis of bigrams').

Collocations (Từ đi kèm)

Adjective + bigram
  • frequent bigram
    (bigram thường gặp)
  • common bigram
    (bigram phổ biến)
  • adjacent bigram
    (bigram liền kề)
Verb + bigram
  • extract bigrams
    (trích xuất các bigram)
  • calculate bigram frequency
    (tính toán tần suất bigram)
  • analyze bigrams
    (phân tích các bigram)
  • generate bigrams
    (tạo ra các bigram)
Noun + bigram
  • bigram frequency
    (tần suất bigram)
  • bigram model
    (mô hình bigram)
  • word bigram
    (bigram từ (một cặp từ))
  • character bigram
    (bigram ký tự (một cặp ký tự))

Interactive Flashcard

Click the card to flip and test your memory.

bigram

danh từ
Lật mặt

Một chuỗi gồm hai phần tử liền kề từ một chuỗi các token, thường là chữ cái, âm tiết hoặc từ.

"Bigram analysis is useful for predicting the next word in a sentence."

Nghe phát âm

Grammar Rules

No specific grammar rules found for this term.

Cultural Context

Khám phá các khía cạnh văn hóa và xã hội thú vị xoay quanh từ "bigram".

Bigram và việc giải mật mã

Phân tích tần suất bigram là một kỹ thuật cổ điển nhưng rất mạnh mẽ trong việc giải mật mã. Trong tiếng Anh, các cặp chữ cái như 'th', 'he', 'in' xuất hiện rất thường xuyên. Bằng cách đếm tần suất các cặp chữ cái trong một bản tin mã hóa và so sánh chúng với tần suất chuẩn của ngôn ngữ, các nhà giải mã có thể tìm ra manh mối quan trọng để phá vỡ mật mã thay thế.

Bạn đang gõ, máy tính đang đoán!

Khi bạn gõ bàn phím trên điện thoại và nó đề xuất từ tiếp theo, đó chính là lúc các mô hình n-gram (bao gồm cả bigram) đang hoạt động. Điện thoại của bạn đã 'học' từ một kho dữ liệu văn bản khổng lồ để biết rằng sau từ 'thank', từ 'you' có khả năng xuất hiện cao nhất. Bằng cách phân tích các bigram (cặp từ), hệ thống có thể dự đoán từ bạn định gõ, giúp việc nhắn tin nhanh hơn.