[Xác Suất] Khái niệm cơ bản

Công thức bù xác suất

Video Công thức bù xác suất

Lý thuyết xác suất là công cụ cơ bản và tiền đề cho học máy. hiểu về lý thuyết xác suất là điều cần thiết để có thể bước vào lĩnh vực này. Trong phần này, tôi sẽ viết lại các định nghĩa và lý thuyết cơ bản của xác suất thống kê.

1.1. kiểm tra và sự kiện

thử nghiệm là một thử nghiệm dẫn đến một sự kiện (còn được gọi là một sự kiện). ví dụ, tung một con xúc xắc 6 mặt được coi là một phép thử, kết quả của nó là sự xuất hiện của một mặt 1 điểm, 2 điểm, … 6 điểm, và những kết quả này được gọi là sự kiện bắt nguồn từ viên xúc xắc- kiểm tra cuộn. .

vì vậy chúng tôi có thể chia sự kiện thành 3 loại chính:

  • sự kiện chắc chắn : sự kiện luôn xảy ra
  • sự kiện không thể xảy ra : sự kiện không bao giờ xảy ra
  • sự kiện ngẫu nhiên : sự kiện có thể xảy ra hoặc không xảy ra

Các sự kiện trong cùng một thử nghiệm có thể có các mối quan hệ chính sau:

  • sự kiện : là hai sự kiện không xảy ra đồng thời. sự kiện ngược lại của $ a $ được ký hiệu là $ bar {a} $. sự kiện này còn được gọi là sự kiện bù đắp $ a $ và được ký hiệu là $ a ^ c $.
  • sự kiện đối sánh : đây là sự kiện xảy ra khi có ít nhất một trong những sự kiện thành phần xảy ra. sự kiện hợp nhất của $ a $ và $ b $ được biểu thị bằng $ a cup b $ hoặc $ a + b $. trường hợp chung, liên hợp các sự kiện $ {a_i }, i = overline {1, n} $ là $ displaystyle bigcup_ {i = 1} ^ n {a_i} $ hoặc $ displaystyle sum_ {i = 1} ^ n {a_i} $.
  • sự kiện phân phối : là sự kiện xảy ra khi tất cả các sự kiện thành phần xảy ra cùng nhau. giao điểm của hai sự kiện $ a $ và $ b $ được ký hiệu là $ a cap b $ hoặc $ ab $. trong trường hợp chung, giao điểm của các sự kiện $ {a_i }, i = overline {1, n} $ là $ displaystyle bigcap_ {i = 1} ^ n {a_i} $ hoặc $ displaystyle prod_ {i = 1} ^ n {a_i} $.
  • sự kiện xung đột : đây là những sự kiện không xảy ra đồng thời. các sự kiện $ {a_i }, i = overline {1, n} $ xung đột một lần và chỉ khi $ displaystyle bigcap_ {i = 1} ^ n {a_i} = blankset $.
  • sự kiện độc lập : Các sự kiện được cho là độc lập nếu và chỉ khi sự xuất hiện của một sự kiện không ảnh hưởng đến sự xuất hiện của nhóm sự kiện khác. thì có thể thấy rằng nếu 2 sự kiện $ a, b $ độc lập thì $ a, bar {b} $; $ bar {a}, b $; $ bar {a}, bar {b} $ cũng độc lập.
  • không gian sự kiện : là tập hợp tất cả các sự kiện độc lập có thể có. không gian sự kiện được biểu thị bằng: $ omega $.

Ở đây cần lưu ý rằng các phép toán quan hệ của các dữ kiện trên giống với phép toán của đại số Boolean, vì vậy tất cả các thuộc tính và hệ quả của đại số Boolean đều áp dụng cho các sự kiện.

  • giao hoán :
    • $ a cup b = b cup a $
    • $ a cap b = b cap a $
    • $ a cup (b cup c) = (a cup b) cup c $
    • $ a cap (b cap c) = (a cap b ) cap c $
    • $ a cap (b cup c) = a cap b cup a cap c $
    • $ a cup (b cap c) = (a cup b) cap (a cup c) $
    • $ overline { overline {a}} = a $
    • $ overline {a cup b} = bar {a} cap bar {b} $
    • $ overline {a cap b} = bar {a} cup bar {b} $

    1.2. định nghĩa xác suất

    tần suất của một sự kiện $ a $ là sự xuất hiện của nó $ n_a $ sau khi chạy thử nghiệm $ n $.

    $$ f_n (a) = frac {n_a} {n} $$

    Định nghĩa xác suất theo luật số lớn là giới hạn tần suất của sự kiện khi số lần thử lên đến vô cùng.

    $$ p (a) = lim limit_ {n to infty} f_n (a) $$

    Trên thực tế, chúng tôi không có đủ thời gian và điều kiện để thực hiện vô số lần gieo và $ n $ đủ lớn để tần suất $ f_n (a) $ tiếp cận một giá trị hầu như không thay đổi, để mọi người chọn một xấp xỉ đó là xác suất: $ | p (a) – f_n (a) | & lt; epsilon $ trong đó $ epsilon $ là một số dương rất nhỏ.

    Từ đây, chúng ta có thể nhận được một số điều:

    • xác suất của bất kỳ sự kiện nào $ a $ luôn nằm trong khoảng 0, 1: $ p (a) in [0, 1] ~~~ forall $
    • xác suất không thể xảy ra sự kiện là 0: $ p ( blankset) = 0 $
    • xác suất của một sự kiện hoặc không gian sự kiện nhất định là 1: $ p ( omega) = 1 $
    • xác suất rằng hợp của hai sự kiện độc lập $ a, b $ là tổng của chúng: $ p (a + b) = p (a) + p (b) $
    • xác suất ngụ ý $ a subseteq b $ thì: $ p (a) le p (b) $

    Tương tự như quan hệ sự kiện, chúng ta cũng có quan hệ xác suất.

    2.1. tổng xác suất

    tổng các xác suất là xác suất của sự kiện tham gia. đối với tập hợp các sự kiện $ {a_i }, i = overline {1, n} $, thì chúng ta có:

    Xem thêm: 130 các món ngon từ thịt lợn (heo) dễ làm, lạ miệng

    $$ begin {align} p Big sum_ {1 le i_1 & lt; i_2 le n} p (a_ {i_1} a_ {i_2}) cr & amp; + sum_ {1 le i_1 & lt; i_2 & lt; i_3 le n} p (a_ {i_1} a_ {i_2} a_ {i_3}) cr & amp; – ldots + (-1) ^ {n + 1} p (a_1a_2 ldots a_n) end {căn chỉnh } $$

    hoặc viết tắt nó thành:

    $$ p osystem ( bigcup_ {i = 1} ^ n {a_i} Big) = sum_ {i = 1} ^ n (-1) ^ {i + 1} sum_ {1 le k_1 & lt; • & lt; k_i le n} p big ( bigcap_ {j = 1} ^ ia_ {k_j} big) $$

    trong đó, tổng $ displaystyle sum_ {1 le k_1 & lt; • & lt; k_i le n} p big ( bigcap_ {j = 1} ^ ia_ {k_j} big) $ là tổng của tất cả các xác suất chặn của một tập con $ i $ của tập $ {1,2…, n } $. thì chúng ta có thể thấy rằng mỗi tổng này sẽ bao gồm các phần tử $ dbinom {n} {i} = dfrac {n!} {i! (n-i)!} $.

    Xem Thêm : Review chi tiết ngành Công nghệ thực phẩm

    ví dụ: $$ begin {align} & amp; p (a + b) = p (a) + p (b) -p (ab) cr & amp; p (a + b + c) = p (a) + p (b) + p (c) -p (ab) -p (ac) -p (bc) + p (abc) end {align} $$

    sau đó, chúng ta có thể thấy mối tương quan rất chặt chẽ giữa công thức trên và sơ đồ tĩnh mạch. tổng các xác suất chính của các vùng tích phân của các tập hợp khi được biểu diễn bằng sơ đồ tĩnh.

    Từ công thức trên, chúng ta có thể thấy rằng:

    $$ p osystem ( bigcup_ {i = 1} ^ n {a_i} Big) le sum_ {i = 1} ^ np (a_i) $$

    dấu bằng đạt được khi tập hợp các sự kiện này loại trừ lẫn nhau:

    $$$

    nếu những sự kiện này tạo thành không gian sự kiện $ omega $ thì:

    $$ p ( omega) = sum_ {i = 1} ^ np (a_i) = 1 $$

    do, $ a $ và $ bar {a} $ tạo thành không gian sự kiện, vì vậy chúng ta có: $$ begin {align} & amp; p (a) + p ( bar {a}) = 1 cr iff & amp; p (a) = 1 – p ( bar {a}) cr iff & amp; p ( bar {a}) = 1 – p (a) end {align} $ $

    2.2. xác suất có điều kiện

    là xác suất của một sự kiện xảy ra khi biết xác suất của một sự kiện khác xảy ra. xác suất của một sự kiện $ a $ cho rằng $ b $ đã xảy ra được ký hiệu là $ p (a | b) $. công thức cho xác suất từ ​​$ thành $ được xác định như sau:

    $$ p (a | b) = frac {p (ab)} {p (b)} ~~~ forall p (b)> 0 $$

    Xem thêm: Đi tìm công thức nấu món tôm cực hấp dẫn

    nếu $ a $ và $ b $ độc lập, nghĩa là $ a $ không phụ thuộc vào $ b $ thì: $ p (a | b) = p (a) $ và $ p (b | a) = p (b) $.

    xác suất có điều kiện có các thuộc tính giống như xác suất bình thường:

    • $ displaystyle p ELECT ( bigcup_ {i = 1} ^ n {a_i | b} Big) = sum_ {i = 1} ^ n (-1) ^ {i -1} sum_ {k_1 le cdots le k_i} p big ( bigcap_ {j = 1} ^ ia_ {k_j} | b big) $

      $ p ( bar {a} | b) = 1 – p (a | b) $

      2.3. tích xác suất

      tích xác suất là xác suất của sự kiện giao nhau. Từ công thức xác suất có điều kiện, chúng ta có thể tính xác suất đánh chặn như sau:

      $$ p (ab) = p (b) p (a | b) = p (a) p (b | a) $$

      trường hợp chung, đối với $ {a_i }, i = overline {1, n} $, tích xác suất của nó được tính như sau: $$ p ELECT ( bigcap_ {i = 1} ^ na_i opens ) = p (a_1) p (a_2 | a_1) p (a_3 | a_1a_2)… p (a_n | a_1a_2… a_ {n-1}) $$ hoặc viết tắt là: $$ p ELECT ( bigcap_ {i = 1 } ^ na_i expand) = prod_ {i = 1} ^ np big (a_i | bigcap_ {j = 1} ^ {i-1} a_j Big) $$

      Tích xác suất còn được gọi là quy tắc chuỗi xác suất do sự biểu diễn liên tục của chuỗi như đã lưu ý ở trên.

      Xem Thêm : Chỉ số BMR chuẩn là gì? Cách tính chỉ số BMR cho dân gymer

      nếu $ {a_i } $ độc lập theo cặp thì chúng ta có:

      $$ p big ( bigcap_ {i = 1} ^ na_i big) = prod_ {i = 1} ^ np (a_i) $$

      tạo $ 0 le p (a_i) le 1 $ sao cho xác suất của sản phẩm không thể lớn hơn xác suất của thành phần:

      $$ p ELECT ( bigcap_ {i = 1} ^ na_i Big) le min big (p (a_i) Big) $$

      2.4. xác suất sau – bayes

      Từ công thức tính tích xác suất, chúng ta có suy luận sau:

      Xem thêm: Tìm việc làm Thực Tập Sinh, tuyển dụng Thực Tập Sinh

      $$ p (a) p (b | a) = p (b) p (a | b) $$

      Từ đó, chúng ta có thể tính xác suất để $ a $ biết $ b $ như sau:

      $$ p (a | b) = frac {p (a) p (b | a)} {p (b)} $$

      ở đâu:

      • $ p (a | b) $: xác suất sau
      • $ p (a) $: xác suất trước
      • $ p (b) $: hằng số chuẩn hóa
      • $ p (b | a) $: xác suất

      trường hợp mở rộng, đối với hệ thống xác suất trước $ {a_i }, i = overline {1, n} $, cho bất kỳ sự kiện nào $ b $, vì $ displaystyle p big ( bigcup_ {i = 1 } ^ na_i big) = 1 $ chúng ta có:

      $$ begin {align} p (b) & amp; = p big (b bigcup_ {i = 1} ^ na_i big) cr iff p (b) & amp; = p big ( bigcup_ {i = 1} ^ nba_i big) cr iff p (b) & amp; = sum_ {i = 1} ^ np (ba_i) cr iff p (b) & amp; = sum_ {i = 1} ^ np (a_i) p (b | a_i) end {align} $$

      Công thức trên được gọi là công thức xác suất hoàn chỉnh. nếu $ p (b) & gt; 0 $ nên với $ a in {a_i} $ bất kỳ, chúng ta có thể tính xác suất của $ a $ sau khi quan sát $ b $ như sau:

      $$ p (a | b) = frac {p (a) p (b | a)} { sum_ {i = 1} ^ np (a_i) p (b | a_i)} $$

      2.5. công thức bernoulli (bernoulli)

      một bài kiểm tra chỉ trả về 2 sự kiện, $ a $ xảy ra với xác suất $ p (a) = p $ hoặc $ a $ không xảy ra với xác suất $ p ( bar {a}) = 1 – p = q $ được gọi là phép thử bec-nu-li. thì xác suất sự kiện $ a $ đúng $ k $ lần được tính theo công thức bec-nu-li như sau:

      $$ p (a ^ k) = dbinom {n} {k} p ^ kq ^ {n-k} $$

      chứng minh: Gọi $ b $ là biến cố $ a $ xảy ra đúng $ k $ lần. Vì chúng tôi không quan tâm đến thứ tự xảy ra các sự kiện $ a $, chúng tôi có tổng số kết quả $ dbinom {n} {k} $. nói cách khác, $ b $ là tổng của $ dbinom {n} {k} $ sự kiện. Vì các kết quả này là độc lập, chúng ta có thể biểu diễn $ p (b) $ như sau: $$ p (b) = dbinom {n} {k} p (b_0) $$ trong đó, $ b_0 $ là sự kiện mà $ a $ xảy ra đúng $ k $ lần và $ bar {a} $ xảy ra $ n-k $ lần. Vì hai sự kiện này độc lập nên chúng ta có $ p (b_0) = p (a_k) p ( bar {a_k}) $. ngoài ra, vì $ a $ xảy ra $ k $ lần, khi đó: $ p (a_k) = p ^ k $ và $ bar a $ xảy ra $ n-k $ lần, khi đó: $ p ( bar {a_k}) = q ^ {nk} $. thì $ p (b_0) = p ^ kq ^ {n-k} $. thay $ p (b_0) $ trong công thức trước đó chúng ta sẽ có: $$ p (b) = dbinom {n} {k} p ^ kq ^ {n-k} $$

      Dễ dàng thấy rằng để $ a $ xảy ra $ [k_1, k_2] $ lần, xác suất sẽ là tổng của mỗi xác suất thành phần: $$ begin {align} p (a; k_1, k_2) & amp; = sum_ {k = k_1} ^ {k_2} p (a ^ k) cr & amp; = sum_ {k = k_1} ^ {k_2} dbinom {n} {k} p ^ kq ^ {n-k} end {align} $$

      phép thử bec-nullium được sử dụng rộng rãi trong thực tế, ví dụ như đối với các bài toán phân loại nhị phân (chỉ có 2 nhãn), chúng ta có thể sử dụng công thức này để tính xác suất có bao nhiêu phân tử thuộc một nhãn nhất định.

      Bài viết này giới thiệu các khái niệm cơ bản về xác suất, cách tính tổng, tích, xác suất có điều kiện và đặc biệt là công thức xác suất hậu Bayes. trong phần tiếp theo chúng ta sẽ xem xét các khái niệm xác suất với các biến ngẫu nhiên cùng với một số mô hình xác suất phổ biến. những mô hình xác suất này là nền tảng mỏng của các bài toán học máy. Và bây giờ, nếu bạn có bất kỳ câu hỏi hoặc góp ý nào, đừng quên để lại bình luận bên dưới nhé!

Nguồn: https://truongxaydunghcm.edu.vn
Danh mục: Công thức

Related Articles

Back to top button