Nghiên cứu sâu hơn về tiêu chuẩn có ngưỡng & bước đầu ứng dụng vào khai phá dữ liệu

LỜI CẢM ƠN Đầu tiên, em xin chân thành cảm ơn thày giáo Bùi Công Cường đã giúp đỡ em rất nhiều trong quá trình tìm kiếm tài liệu cũng như hoàn thành báo cáo của mình. Sự chỉ bảo tận tình của thày trong suốt quá trình từ những ý tưởng ban đầu cho đến khi báo cáo được hoàn thành là trợ giúp lớn nhất đối với em. Sau đó, em xin chân thành cảm ơn các thày, cô giáo đã giảng dạy em, đặc biệt là các thày, cô giáo của khoa Toán Tin ứng dụng, trường Đại học Bách Khoa Hà Nội. Những kiến thức thu nhận đượ

doc86 trang | Chia sẻ: huyen82 | Lượt xem: 1168 | Lượt tải: 0download
Tóm tắt tài liệu Nghiên cứu sâu hơn về tiêu chuẩn có ngưỡng & bước đầu ứng dụng vào khai phá dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
c từ các thày, cô đã hỗ trợ em rất nhiều trong quá trình hoàn thành báo cáo này. Em cũng xin cảm ơn các bạn học cùng lớp Toán Tin-KSTN K45, Đại học Bách Khoa Hà Nội, các anh chị và các bạn thuộc Seminar Lý thuyết mờ và Mạng Nơron, những đóng góp của mọi người đã giúp em có thể hoàn chỉnh được báo cáo. Cuối cùng, em xin gửi lời cảm ơn tới cha mẹ, chị gái của em, sự cổ vũ động viên của mọi người là động lực rất lớn giúp em có thể hoàn thành được báo cáo này. Em xin phép được sử dụng cụm từ “chúng tôi” trong báo cáo bao gồm em và mọi nguời. MỤC LỤC GIỚI THIỆU Khái niệm t-chuẩn có ngưỡng do Dubois, Prade giới thiệu đầu tiên trong [14], sau đó được Iancu xem xét một cách đầy đủ hơn trong [31]. Sau đó, một số kết quả về các lớp toán tử mờ có ngưỡng, t-chuẩn, t-đối chuẩn, và kéo theo đã được xem xét trong [9-13]. Cũng giống như toán tử mờ, toán tử mờ có ngưỡng có một phạm vi ứng dụng rộng lớn tử trong điều khiển học, trong trí tuệ nhân tạo, đặc biệt là trong các vấn đề về hệ suy diễn và khai phá dữ liệu. Tìm kiếm luật kết hợp là một trong những hướng nghiên cứu quan trọng trong khai phá dữ liệu [38]. Bài toán tìm luật kết hợp boolean được giới thiệu lần đầu tiên trong [2]. Ví dụ cho luật này có thể là như sau: “90% số người mua bơ và sữa sẽ mua cả bánh mì”. Đã có nhiều thuật toán được đưa ra nhằm giải quyết bài toán này, như Apriori [3], FP-growth [27,23], Eclat [1]… Bài toán luật kết hợp lượng hoá được nêu ra trong [40]. Lấy ví dụ, một luật kết hợp lượng hoá cho cơ sở dữ liệu với ba thuộc tính về có thể là “ và → ”. Thuật toán đưa ra trong [40] phân hoạch miền giá trị của các thuộc tính thành các khoảng và sau đó kết hợp các khoảng rời nhau để cho lời giải của bài toán. Thao tác này thực chất là chuyển bài toán luật kết hợp lượng hoá về bài toán luật kết hợp boolean. Mặc dù phương pháp phân hoạch dữ liệu cũng giải quyết được một số bài toán tìm luật kết hợp trên cơ sở dữ liệu lượng hoá. Tuy nhiên, cũng có một số vấn đề phát sinh như trong [35] đã chỉ ra. Đó là vấn đề mất mát thông tin nếu như có nhiều giá trị tập trung xung quanh các biên của các khoảng. Việc chia các giá trị gần nhau vào các khoảng khác nhau sẽ dẫn tới việc mất thông tin trong các phân tích về sau. Một phương pháp tiếp cận khác là chia miền dữ liệu thành các vùng có chồng lên nhau. Khi đó, các phần tử nằm gần biên có thể thuộc nhiều hơn một khoảng, và sẽ giải quyết được phần nào vấn đề mất mát thông tin tại các lân cận biên. Tuy nhiên, tiếp cận này vẫn có phần bất hợp lý do việc phần tử gần biên cũng sẽ có vai trò quan trọng trong việc mô tả đặc trưng của khoảng giống như các phần tử gần trung tâm. Tất cả những vấn đề trên chủ yếu xuất phát từ việc sử dụng biên rõ ràng để chia khoảng. Từ đó, trong [35] đã đề nghị sử dụng tiếp cận mờ. Tập mờ cung cấp thay đổi uyển chuyển giữa các vùng dữ liệu, và vấn đề xuất phát từ biên rõ sẽ được loại bỏ. Trong [35], các luật kết hợp mờ có dạng, “Nếu X là A thì Y là B”, trong đó “X là A” được gọi là phần tiền tố của luật, “Y là B” được gọi là phần hệ quả của luật. X và Y là các tập thuộc tính của cơ sở dữ liệu, A và B là các tập từ mô tả X và Y tương ứng. Báo cáo này tập trung nghiên cứu sâu về toán tử mờ có ngưỡng, đồng thời xem xét một khía cạnh ứng dụng vào bài toán luật kết hợp mờ. Chương 2 của báo cáo tập trung vào các nghiên cứu sâu về toán tử mờ có ngưỡng, mô tả các khái niệm về lớp toán tử mờ có ngưỡng đồng dạng, cặp hàm sinh của lớp các toán tử mờ có ngưỡng đồng dạng. Chương 3 của báo cáo mô tả về bài toán luật kết hợp mờ, vấn đề mờ hóa dữ liệu đầu vào, đồng thời xem xét ứng dụng t-chuẩn có ngưỡng vào việc bài toán luật kết hợp mờ. Phần phụ lục cuối báo cáo cung cấp các lớp toán tử mờ có ngưỡng có tham số, mô tả về chương trình Fuzzy Rules Miner cài đặt thuật toán F-Apriori, cấu trúc các file dữ liệu đầu vào và các kết quả chạy thử nghiệm chương trình. TOÁN TỬ MỜ CÓ NGƯỠNG Sự ra đời của công nghệ tính toán mờ xuất phát từ các giới thiệu về tập mờ của Zadeh năm 1965 [41]. Hiện nay, có thể nói, công nghệ tính toán mờ là một trong những lĩnh vực nghiên cứu phát triển mạnh mẽ nhất, được đánh dấu bằng sự ra đời của hàng loạt phương pháp và kỹ thuật ứng dụng trong nhiều lĩnh vực khác nhau. Việc tích hợp các kỹ thuật của lôgíc mờ với các phương pháp phân tích khác ngày càng diễn ra mạnh mẽ. Lôgíc mờ được ứng dụng rộng rãi để giải quyết rất nhiều bài toán của khoa học ứng dụng. Những lĩnh vực có thể kể ra ở đây là vận trù học, hỗ trợ quyết định, điều khiển, nhận dạng mẫu, kinh tế, quản lý, xã hội học, mô hình thống kê, máy học, thiết kế cơ khí, chế tạo, phân lớp, suy luận, thu nhận thông tin, quản lý cơ sở dữ liệu, chẩn đoán y tế, hệ cơ sở tri thức. Đặc biệt, trong lĩnh vực xử lý tri thức, công nghệ tính toán mờ tỏ ra vô cùng hiệu quả. Do tri thức thường con người thường được biểu diễn bằng các thể hiện ngôn ngữ, bằng các câu hỏi, các phát biểu về thế giới đang xét. Vấn đề đối với việc xử lý tri thức là không chỉ ở việc liên kết các tri thức, các phát biểu về thế giới đang xét, mà còn ở việc đánh giá sự đúng đắn của chúng. Lôgíc hình thức cổ điển cho phép chúng ta đánh giá một phát biểu về thế giới là hoặc đúng, hoặc sai. Tuy nhiên, trong thực tế, đánh giá một phát biểu chỉ có đúng hoặc sai là rất khó nếu không muốn nói là phi thực tế. Lấy ví dụ: đối với các tri thức dạng “Áp suất cao”, “Thể tích nhỏ”, “Quả táo đỏ”, việc xác định một cách chính xác trị chân lý của chúng là không hay một là rất khó khăn do các từ “cao”, “nhỏ”, hay “đỏ” hoàn toàn có tính chất mờ hồ. Từ đó, Zadeh đã mở rộng lôgíc mệnh đề thành lôgíc mờ, trong đó, mỗi mệnh đề P sẽ được gán cho một trị chân lý υ(P), là một giá trị trong đoạn [0,1], biểu diễn mức độ đúng đắn của mệnh đề đó. Hay Để có thể tiến hành các thao tác lôgíc trên các mệnh đề, chúng ta cần phải có các phép toán lôgíc mờ. Đó chính là các phép toán t-chuẩn tương ứng với phép hội, t-đối chuẩn ứng với phép tuyển, và phép kéo theo mờ. Bên cạnh đó, ngưỡng cũng là khái niệm hết sức tự nhiên trong các bài toán của thế giới thực. Những suy luận có sử dụng ngưỡng là rất hay gặp trong đời sống. Lấy ví dụ, trong công tác chẩn đoán bệnh nhân. Nếu một số thông số đầu vào đạt những giá trị ngưỡng, dạng như nhiệt độ trên 41oC, nhịp tim trên 150, … hiển nhiên chúng ta phải có những suy luận khác với khi các giá trị này chưa đạt giá trị ngưỡng. Chương này tập trung vào việc nghiên cứu các toán tử mờ có ngưỡng sử dụng làm công cụ cho quá trình trích rút các luật mờ. Mở đầu của các nghiên cứu về toán tử mờ có ngưỡng chính là t-chuẩn có ngưỡng. Khái niệm t-chuẩn có ngưỡng do Dubois, Prade giới thiệu đầu tiên trong [14], sau đó được Iancu xem xét một cách đầy đủ hơn trong [31]. Sau đó, một số kết quả về các lớp toán tử mờ có ngưỡng t-chuẩn, t-đối chuẩn, và kéo theo đã được xem xét trong [9-13]. Chương này sẽ nhắc lại các khái niệm về toán tử mờ, toán tử mờ có ngưỡng, lớp toán tử mờ có ngưỡng đồng dạng. Đồng thời, chúng tôi sẽ tiến hành xem xét một số tính chất đại số của các lớp này. Phần cuối chương là các xem xét giải tích đối với các lớp toán tử mờ tham số nhằm làm tiền đề cho việc tạo ra các toán tử mờ có ngưỡng tham số. Trước hết, chúng ta bắt đầu bằng việc tìm hiểu về các toán tử mờ và một số tính chất đặc trưng của chúng. Toán tử mờ Toán tử mờ là những phép toán trên lôgíc mờ, nghĩa là những phép toán trên các giá trị lôgíc của các mệnh đề. Như thế, một cách tổng quát, các phép toán trên đoạn [0,1] đều có thể là toán tử mờ. Trong phần này chúng ta sẽ tìm nhắc lại các định nghĩa và một số tính chất của các phép toán lôgíc cơ bản, đó là phép phủ định, phép hội hay t-norm, phép tuyển hay t-conorm. Phủ định Định nghĩa 2.1.1[28]. Hàm n : [0,1] → [0,1] được gọi là hàm phủ định nếu nó không tăng đồng thời n(0) = 1 và n(1) = 0. Một hàm phủ định được gọi là phủ định chặt nếu nó giảm chặt. Một hàm phủ định được gọi là phủ định mạnh nếu nó là phủ định chặt, đồng thời n(n(x)) = x với mọi x [0,1]. Định lý 2.1.1[28]. n là phép phủ định chặt nếu và chỉ nếu tồn tại f thuộc Aut(J) sao cho n(x) = f-1(1-f(x)). Ở đây, ta chú ý η = 1 - x là một hàm phủ định chặt, và biểu diễn của n trong định lý có thể được viết thành n(x) = f-1(η(f(x))). f khi đó được gọi là hàm sinh của n, và n có thể được biểu diễn dạng ηf. T-chuẩn Định nghĩa 2.1.2[28]. Một hàm T : [0,1]×[0,1] → [0,1] được gọi là một t-chuẩn (tương ứng với phép hội trong lôgíc mệnh đề), nếu nó có tính giao hoán, kết hợp, đơn điệu không giảm theo từng biến, đồng thời T(x,1) = x với mọi x [0,1]. Một t-chuẩn được gọi là liên tục nếu nó liên tục theo từng biến. Một t-chuẩn được gọi là t-chuẩn Archimedean nếu nó liên tục, đồng thời: T(x,x) < x với mọi x (0,1). Một t-chuẩn được gọi là t-chuẩn chặt nếu nó là Archimedean, đồng thời: không tồn tại x, y (0,1) sao cho T(x,y) = 0. Một t-chuẩn được gọi là t-chuẩn nilpotent nếu nó là Archimedean, đồng thời: tồn tại x, y (0,1) sao cho T(x,y) = 0. T-đối chuẩn Định nghĩa 2.1.3[28]. Một hàm S : [0,1]×[0,1] → [0,1] được gọi là một t-đối chuẩn (tương ứng với phép tuyển) nếu nó có tính giao hoán, kết hợp, đơn điệu không giảm theo từng biến, đồng thời S(0,x) = x với mọi x [0,1]. Kết quả sau đây cho ta thấy mối tương quan giữa t-chuẩn và t-đối chuẩn. Định lý 2.1.2[28]. S là t-đối chuẩn nếu và chỉ nếu tồn tại t-chuẩn T và phủ định mạnh n sao cho S(x,y) = n(T(n(x),n(y))) với mọi x,y [0,1]. Cặp (T,S) được gọi là đối ngẫu nhau qua phủ định mạnh n. Bộ ba (T,n,S) được gọi là bộ ba De Morgan. Một t-đối chuẩn được gọi là liên tục, Archimedean, chặt, nilpotent nếu đối ngẫu của nó là liên tục, Archimedean, chặt, nilpotent tương ứng. Kéo theo Định nghĩa 2.1.4[19]. Một hàm I: [0,1]×[0,1]→[0,1] là một hàm kéo theo nếu thoả các tính chất sau: I(x,y) ≥ I(u,y) nếu x ≤ u I(x,y) ≥ I(x,v) nếu y ≥ v I(0,x) = 1 I(x,1) = 1 I(1,0) = 0 Trong thực tế, người ta thường sử dụng các hàm kéo theo được định nghĩa dựa trên các toán tử khác như t-chuẩn, t-đối chuẩn và hàm phủ định. Ta có các kết quả sau: Mệnh đề 2.1.3[19]. Cho S là t-đối chuẩn, n là hàm phủ định chặt, thế thì I(x,y) = S(nx,y) là một hàm kéo theo. Mệnh đề 2.1.4[19]. Cho T là t-chuẩn, thế thì I(x,y) = supz{T(x,z) ≤ y} là hàm kéo theo. Phần tiếp theo là các khái niệm về toán tử mờ có ngưỡng đồng dạng, đồng thời chúng tôi cũng sẽ nhắc lại một số tính chất của các toán tử mờ sau đó xem xét mở rộng sang t-chuẩn có ngưỡng. Toán tử mờ có ngưỡng Toán tử mờ có ngưỡng cũng là các toán tử biểu diễn các phép toán trên các giá trị chân lý của các mệnh đề trong lôgíc mờ. Bênh cạnh đó, mỗi toán tử thuộc loại này sẽ được gắn thêm các giá trị ngưỡng nhằm biểu diễn sự suy diễn theo ngưỡng mà chúng tôi đã nói đến ở phần đầu chương. t-chuẩn có ngưỡng Trước hết chúng ta sẽ xem xét định nghĩa về t-chuẩn có ngưỡng. Ký hiệu J = [0,1]. Cho t1, t2 là hai t-chuẩn, ký hiệu t1 ≥ t2 nếu và chỉ nếu t1(x,y) ≥ t2(x,y) với mọi x, y J. Cho α là ngưỡng, nghĩa là α = (αx,αy), với 0 ≤ αx,αy ≤ 1. Cho t1, t2 là các t-chuẩn sao cho t1 ≥ t2. Định nghĩa 2.2.1[9]. t-chuẩn có ngưỡng T(x,y,α) được định nghĩa trên J2 như sau: T(x,y,α) = Định nghĩa 2.2.2. Lớp các t-chuẩn có ngưỡng đồng dạng là tập các t-chuẩn có ngưỡng được xác định như sau: = Ta có thể thấy, việc xác định một t-chuẩn có ngưỡng tương ứng với việc xác định hai t-chuẩn t1, t2, và ngưỡng α, việc xác định một lớp các t-chuẩn có ngưỡng đồng dạng tương ứng với việc xác định hai t-chuẩn t1 và t2. Ta cũng gọi T(x,y,α) là t-chuẩn có ngưỡng liên tục, Archimedean, chặt, nilpotent, nếu t1, t2 là liên tục, Archimedeanm chặt, nilpotent tương ứng. Từ các định nghĩa về t-chuẩn nilpotent và t-chuẩn chặt, và ràng buộc t1 ≥ t2, ta có thể thấy t-chuẩn có ngưỡng Archimedean có thể chia làm ba loại: t-chuẩn có ngưỡng chặt t-chuẩn có ngưỡng nilpotent t-chuẩn có ngưỡng hỗn hợp (t1 là chặt và t2 là nilpotent). Ta có kết quả sau thu được trực tiếp từ định nghĩa. Mệnh đề 2.2.1[9]: Với mọi α [0,1], với mọi x,y [0,1], ta luôn có t1(x,y) ≥ T(x,y,α) ≥ t2(x,y). Trong các bài toán cụ thể, nói chung, miền ngưỡng α được đưa ra dựa trên ý kiến của các chuyên gia, chúng phụ thuộc vào thế giới đang được xem xét. Sau đây, chúng tôi sẽ xem xét về các phương pháp để xây dựng các lớp t-chuẩn có ngưỡng đồng dạng Archimedean, nói cách khác là việc tạo ra các bộ t1, t2 thoả t1(x,y) ≥ t2(x,y) với mọi x,y. Trước hết, ta nhắc lại phương pháp sử dụng hàm sinh, trong [28], sau đó, ta sẽ xem xét mở rộng cho t-chuẩn có ngưỡng với cặp hàm sinh. Ký hiệu Aut(J) là tập các tự đẳng cấu của J, nghĩa là tập các song ánh J → J, bảo toàn thứ tự. Aut(J,a) là tập các song ánh bảo toàn thứ tự J → [a,1] với a [0,1). Ký hiệu z1 z2 = max(z1,z2) z1 z2 = min(z1,z2) Định lý 2.2.2[28]. Cho t là t-chuẩn Archimedean nếu và chỉ nếu tồn tại f tăng chặt: [0,1] → [0,1], với f(1) = 1, sao cho: t(x,y) = f-1(f(x)f(y) f(0)) hàm f được xác định duy nhất sai khác một số mũ dương. Hàm f ở trên được gọi là hàm sinh nhân tính của t-chuẩn Archimedean t. Ta cũng có thể thấy, nếu t là t-chuẩn chặt thì f(0) = a = 0, còn nếu t là t-chuẩn nilpotent, ta có f(0) > 0. Bên cạnh việc biểu diễn các t-chuẩn Archimedean thông qua hàm sinh nhân tính, chúng ta cũng có thể sử dụng hàm sinh cộng tính để xây dựng các t-chuẩn này [28]. Định lý 2.2.3 [28] Cho t là t-chuẩn Archimedean nếu và chỉ nếu tồn tại hàm g liên tục, giảm chặt: [0,1] → [0,∞], với g(1) = 0, sao cho: t(x,y) = g-1(g(x)+g(y)g(0)) hàm g xác định duy nhất sai khác một hằng số nhân dương. Hàm g được gọi là hàm sinh cộng tính của t-chuẩn t. Và nếu t là t-chuẩn chặt, ta có g(0) = ∞, nếu t là t-chuẩn nilpotent, ta có g(0) < ∞. Kết quả sau cho ta mối tương quan giữa hàm sinh nhân tính và hàm sinh cộng tính. Mệnh đề 2.2.4 [28]. Cho t là t-chuẩn Archimedean với g là hàm sinh cộng tính, thế thì f(x) = e-g(x) là hàm sinh nhân tính của t. Ký hiệu tf là t-chuẩn sinh bởi hàm sinh nhân tính (cộng tính) f. Ta có thể thấy, lớp các t-chuẩn có ngưỡng đồng dạng được xác định dựa theo hai t-chuẩn thành phần t1, t2 sao cho t1 ≥ t2. Để mở rộng khái niệm hàm sinh, trước hết, ta xem xét các kết quả về so sánh giữa hai t-chuẩn Archimedean thông qua các hàm sinh của chúng. Định lý 2.2.5 [34]. Cho t1, t2 là hai t-chuẩn Archimedean với g1, g2 là hai hàm sinh cộng tính tương ứng. Khi đó, t1 ≤ t2 khi và chỉ khi h = g1○g2-1 là hàm dưới cộng tính, nghĩa là: g1○g2-1(u+v) ≤ g1○g2-1(u) + g1○g2-1(v) với mọi u, v [0,g2(0)] sao cho u+v [0,g2(0)]. Định lý 2.2.6. Cho t1, t2 là hai t-chuẩn Archimedean với f1, f2 là hai hàm sinh nhân tính tương ứng. Khi đó, t1 ≤ t2 khi và chỉ khi h = f2○f1-1 là hàm dưới nhân tính, nghĩa là: f2○f1-1(uv) ≤ f2○f1-1(u)f2○f1-1(v) với mọi u, v [f1(0),1] sao cho uv [f1(0),1]. Chứng minh: Trước hết, ta xét điều kiện đủ. Ta có, giả sử f2○f1-1(uv) ≤ f2○f1-1(u)f2○f1-1(v) với mọi u, v [0,f1(0)] sao cho uv [0,f1(0)]. Đặt x = f1-1(u), y = f1-1(v), khi đó x, y [0,1], f1(x)f1(y) [f1(0),1] và u = f1(x), v = f1(y) Từ giả thiết, ta có: f2(0) ≤ f2○f1-1(f1(x)f1(y)) ≤ f2(x)f2(y) tức là: f1-1(f1(x)f1(y)) ≤ f2-1(f2(x)f2(y)) Nghĩa là với mọi x, y [0,f1(0)] sao cho f1(x)f1(y) [f1(0),1] ta có: t1(x,y) = f1-1(f1(x)f1(y) f1(0)) f2-1(f2(x)f2(y) 0) = t2(x,y) Hơn nữa, hiển nhiên, với f1(x)f1(y) ≤ f1(0), thì: t1(x,y) = f1-1(f1(x)f1(y) f1(0)) = 0 ≤ t2(x,y) Chứng minh điều kiện cần tương tự như điều kiện đủ, xét với x, y [0,1] sao cho f1(x)f1(y) [f1(0),1] □. Bổ đề 2.2.7. Cho f1, f2 là hai hàm tăng chặt [0,1] → [0,1] với f1(1) = f2(1) = 1 sao cho f2○f1-1(uv) ≤ (f2○f1-1(u)f2○f1-1(v)) với mọi u, v [f1(0),1] sao cho uv [f1(0),1]. Cho g1, g2 là hai hàm sao cho f1 = , f2 = với r1, r2 > 0 nào đó, thế thì g2○g1-1(uv)) ≤ g2○g1-1(u)g2○g1-1(v) với mọi u,v [g1(0),1] sao cho uv [g1(0),1]. Chứng minh: Trước hết, ta có nếu f1(x) = (x) thì f1-1()= g1-1(x), tương tự cho f2 và g2. Ta lại có, với u, v [g1(0),1] sao cho uv [g1(0),1] thì , [f1(0),1] và [f1(0),1] Xét u, v [g1(0),1] sao cho uv [g1(0),1], ta có: g2○g1-1(uv) = ≤ = g2○g1-1(u)g2○g1-1(v) □. Chứng minh tương tự, ta cũng có kết quả sau. Bổ đề 2.2.8. Cho g1, g2 là hai hàm giảm chặt [0,1] → [0,∞] với g1(1) = g2(1) = 0, sao cho g1○g2-1(u+v) ≤ g1○g2-1(u) + g1○g2-1(v) với mọi u, v [0,g2(0)] sao cho uv [0,g2(0)]. Cho f1, f2 là hai hàm sao cho g1 = r1f1, g2 = r2f2, với r1, r2 > 0 nào đó, thế thì f1○f2-1(u+v) ≤ f1○f2-1(u) + f1○f2-1(v) với mọi u, v [0,f2(0)] sao cho uv [0,f2(0)]. Ký hiệu Aut(J,a1,a2) = {(f1,f2) | f1 Aut(J,a1), f2 Aut(J,a2), h = f1○f2-1 là hàm dưới nhân tính} Aut2(J) = Aut(J,0,0). Xét R+ là tập các số thực dương, ta đồng nhất ký hiệu R+ là tập các hàm dạng x → xr, với r > 0 nào đó. Từ định lý 2.2.2, 2.2.3, 2.2.5, 2.2.6 và bổ đề 2.2.7, 2.2.8 ta có các kết quả sau: Hệ quả 2.2.9. Cho (x,y) là lớp các t-chuẩn có ngưỡng đồng dạng Archimedean với các t-chuẩn thành phần là t1, t2 nếu và chỉ nếu tồn tại a1, a2 thuộc [0,1), và (f1,f2) thuộc Aut(J,a1,a2) sao cho t1(x,y) = f1-1(f1(x)f1(y) a1) và t2(x,y) = f2-1(f2(x)f2(y) a2) đồng thời h = f1○f2-1 là hàm dưới nhân tính. Cặp (g1,g2) khác thoả điều kiện này nếu và chỉ nếu f1 = và f2 = với r1, r2 > 0 nào đó. Hệ quả 2.2.10. Cho (x,y) là lớp các t-chuẩn có ngưỡng đồng dạng Archimedean với các t-chuẩn thành phần là t1 và t2 nếu và chỉ nếu tồn tại g1, g2 là các hàm giảm chặt : [0,1] → [0,∞] sao cho t1(x,y) = g1-1(g1(x)+g1(y)g1(0)) và t2(x,y) = g2-1(g2(x)+g2(y)g2(0)) đồng thời h = g2○g1-1 là hàm dưới cộng tính Cặp (f1,f2) khác thoả điều kiện này nếu và chỉ nếu g1 = r1f1, g2 = r2f2 với r1, r2 > 0 nào đó. Từ đó, ta có định nghĩa về các cặp hàm sinh cho lớp các t-chuẩn có ngưỡng đồng dạng Archimedean như sau. Định nghĩa 2.2.3. Cặp hàm (f1,f2) là các hàm tăng chặt từ [0,1] → [0,1] sao cho f1○f2-1 là hàm dưới nhân tính có thể biểu diễn một lớp t-chuẩn có ngưỡng đồng dạng Archimedean nào đó và được gọi là cặp hàm sinh nhân tính của . Định nghĩa 2.2.4. Cặp hàm (g1,g2) là các hàm giảm chặt từ [0,1] → [0,∞] sao cho g2○g1-1 là hàm dưới cộng tính có thể biểu diễn một lớp t-chuẩn có ngưỡng đồng dạng Archimedean nào đó và được gọi là cặp hàm sinh cộng tính của . Các kết quả về các cặp hàm sinh ở đây, sẽ được sử dụng trong việc xây dựng các lớp toán tử mờ có ngưỡng tham số trong phần cuối của tài liệu này. Ký hiệu G2 là tập tất cả các cặp hàm sinh nhân tính. Cho r R+, ký hiệu r(x) = xr. Trong G2 xét phép hợp thành (f1,f2)○(g1,g2) = (f1○g1,f2○g2). Xét quan hệ tương đương ~ giữa các cặp hàm sinh nếu chúng tạo ra cùng một lớp t-chuẩn có ngưỡng đồng dạng. Khi đó, theo hệ quả 2.2.9, ta có ~ phân hoạch G2 thành các lớp dạng (R+)2(f1,f2). Từ nhận xét trên, ta có các kết quả sau: Hệ quả 2.2.11. Ký hiệu là lớp các t-chuẩn có ngưỡng đồng dạng Archimedean sinh bởi cặp hàm sinh nhân tính (f1,f2), khi đó ánh xạ → (R+)2(f1,f2) là tương ứng một-một giữa tập các lớp t-chuẩn có ngưỡng đồng dạng Archimedean và phân hoạch {(R+)2(f1,f2) : (f1,f2) G2} của G2. Hệ quả 2.2.12. Ánh xạ → (R+)2(f1,f2) là tương ứng một-một giữa tập các lớp t-chuẩn có ngưỡng đồng dạng chặt với phân hoạch {(R+)2(f1,f2) : (f1,f2) G2} của G2. Các kết quả trên cho ta thấy tương ứng giữa các lớp t-chuẩn có ngưỡng đồng dạng với các lớp cặp hàm sinh nhân tính. Sau đây là các kết quả cho ta tương ứng giữa các cặp hàm sinh với các lớp t-chuẩn có ngưỡng đồng dạng. Trước hết, ta xét bổ đề sau: Bổ đề 2.2.13. Cho (a1,a2) (0,1)2. Khi đó, một lớp t-chuẩn có ngưỡng đồng dạng sẽ có duy nhất một cặp hàm sinh nhân tính (f1,f2) sao cho f1(a1) = a1 và f2(a2) = a2. Chứng minh: Cho (f1,f2) G2 là cặp hàm sinh nhân tính của t-chuẩn có ngưỡng đồng dạng Archimedean . Ta có bổ đề tương đương với có duy nhất một phần tử (r1,r2)(f1,f2) trong (R+)2(f1,f2) sao cho (a1) = a1 và (a2) = a2. Giả sử f1(a1) = b1, khi đó, tồn tại duy nhất r1 > 0 sao cho = a1, tương tự với f2, từ đó, ta có đpcm □. Từ bổ đề trên, ta có các kết quả sau: Mệnh đề 2.2.14. Cho a1,a2 (0,1), ký hiệu = {(g1,g2) G2 : g1(a1) = a1 và g2(a2) = a2}. Khi đó, ánh xạ (g1,g2) → là tương ứng một một giữa và tập các lớp t-chuẩn có ngưỡng đồng dạng Archimedean. Hệ quả 2.2.15. Ký hiệu (J) = Aut(J) . Khi đó, ánh xạ (g1,g2) → là tương ứng một một giữa (J) và tập các lớp t-chuẩn có ngưỡng đồng dạng chặt. Sau đây, ta sẽ xét biểu diễn của các lớp t-chuẩn có ngưỡng đồng dạng nilpotent. Giả sử là một lớp t-chuẩn có ngưỡng đồng dạng nilpotent với cặp hàm sinh nhân tính (f1,f2). Nghĩa là f1, f2 là các song ánh bảo toàn thứ tự từ [0,1] vào [b1,1] và [b2,1] tương ứng, với b1, b2 (0,1). Khi đó, với a1,a2 thuộc (0,1) cho trước, tồn tại duy nhất cặp (r1,r2) thuộc (R+)2 sao cho = a1 và = a2. Nghĩa là tồn tại duy nhất cặp (g1,g2) thuộc G2, với g1, g2 là các song ánh bảo toàn thứ tự từ [0,1] vào [a1,1] và [a2,1] tương ứng. Từ đó, ta có kết quả sau: Hệ quả 2.2.16. Cho (a1,a2) thuộc (0,1)2. Khi đó (g1,g2) → là tương ứng một-một giữa các cặp song ánh bảo toàn thứ tự từ [0,1] vào [a1,1] và [a2,1] tương ứng với các lớp t-chuẩn có ngưỡng đồng dạng nilpotent. Đẳng cấu giữa các t-chuẩn có ngưỡng Trước hết, ta xem xét một kết quả trong [28] và một số hệ quả. Định lý 2.2.17[28]. Cho t là t-chuẩn, f thuộc Aut(J), khi đó tf(x,y) = f-1(t(f(x),f(y)) cũng là t-chuẩn. Hơn nữa, nếu t là t-chuẩn liên tục, Archimedean, chặt, nilpotent thì tf cũng là liên tục, Archimedean, chặt, nilpotent tương ứng. Hai t-chuẩn t và tf được gọi là đẳng cấu thông qua hàm f, và f được gọi là đẳng cấu giữa chúng. Hệ quả 2.2.18. Cho T(x,y,α) là t-chuẩn có ngưỡng, khi đó Tf(x,y,α’) := f-1(T(f(x),f(y),α) = là t-chuẩn có ngưỡng α’ := f-1(α) = (f-1(αx),f-1(αy)). Hơn nữa, nếu T là t-chuẩn có ngưỡng liên tục, Archimedean, chặt, nilpotent, hỗn hợp, thì Tf cũng là t-chuẩn có ngưỡng liên tục, Archimedean, chặt, nilpotent, hỗn hợp tương ứng. Chứng minh: Từ định lý 2.2.17, ta có t1’(x,y) = f-1(t1(f(x),f(y))) và t2’(x,y) = f-1(t2(f(x),f(y))) là các t-chuẩn. Mặt khác, do f là song ánh tăng, nên f-1 là song ánh tăng. Mặt khác, ta có t1(x,y) ≥ t2(x,y) t1’(x,y) = f-1(t1(f(x),f(y))) ≥ f-1(t2(f(x),f(y))) = t2’(x,y), vậy Tf(x,y,α’) là t-chuẩn có ngưỡng. Các tính chất của T(x,y,α’) tương ứng với các tính chất của t1’, t2’, tương ứng với các tính chất của t1, t2, tương ứng với các tính chất của T(x,y,α) □. Hai t-chuẩn có ngưỡng T và Tf được gọi là đẳng cấu với nhau thông qua hàm f và f được gọi là đẳng cấu giữa chúng. Hệ quả 2.2.19. Cho = {T(x,y,α)} là lớp các t-chuẩn có ngưỡng đồng dạng và f = {Tf(x,y,α’) : α’ = f-1(α), α [0,1)} cũng là lớp các t-chuẩn có ngưỡng đồng dạng. Hơn nữa, nếu là liên tục, Archimedean, chặt, nilpotent, hỗn hợp thì f cũng là liên tục, Archimedean, chặt, nilpotent, hỗn hợp tương ứng. Chứng minh: Ta có, theo hệ quả 2.2.18, các hàm Tf(x,y,α’) là các t-chuẩn có ngưỡng, hơn nữa, từ f là đẳng cấu trên J, ta có khi αx và αy biến thiên từ 0 tới 1 thì f-1(αx) và f-1(αy) cũng biến thiên từ 0 tới 1. Từ đó ta có f cũng là lớp t-chuẩn có ngưỡng đồng dạng. Các tính chất của f tương ứng với các tính chất của theo hệ quả 2.2.18 □. Hai lớp t-chuẩn có ngưỡng đồng dạng và f được gọi là đẳng cấu với nhau thông qua hàm f và f được gọi là đẳng cấu giữa chúng. Bây giờ chúng ta sẽ xét một vài tính chất về các đẳng cấu giữa các t-chuẩn. Mệnh đề 2.2.20. Cho hai t-chuẩn có ngưỡng: T1(x,y,α1) = (t11,t12,α1)(x,y) và T2(x,y,α2) = (t21,t22,α2). Nếu h là đẳng cấu giữa t11, t21 và là đẳng cấu giữa t12 và t22, đồng thời h(α1x) = α2x, h(α1y) = α2y, thì h là đẳng cấu giữa T1 và T2. Chứng minh mệnh đề này được suy trực tiếp từ định nghĩa. Mệnh đề 2.2.21. Cho hai lớp t-chuẩn có ngưỡng đồng dạng 1 = (t11,t12) và 2 = (t21,t22). h là đẳng cấu giữa 1 và 2 nếu và chỉ nếu h là đẳng cấu giữa t11 và t21, đồng thời là đẳng cấu giữa t12 và t22. Chứng minh: Phần nếu là kết quả trực tiếp của mệnh đề 2.2.20. Sau đây chúng ta xét phần chỉ nếu. Xét T1(x,y,(0,0)) = t11(x,y) thuộc 1, theo định nghĩa, tồn tại T2(x,y,α) thuộc 2 sao cho h(T1(x,y,(0,0)) = T2(h(x),h(y),α), vậy α = (h(0),h(0)) = (0,0). Nghĩa là T2(x,y,α) = t21(x,y), nghĩa là h là đẳng cấu giữa t11 và t21. Tương tự, xét trường hợp khi ngưỡng α = (1,1), ta cũng có h là đẳng cấu giữa t12 và t22 □. Ký hiệu: Aut(J,t1,t2) là tập các đẳng cấu giữa hai t-chuẩn t1,t2. Aut(J,T1,T2) là tập các đẳng cấu giữa hai t-chuẩn có ngưỡng T1, T2. Aut(J,1,2) là tập các đẳng cấu giữa hai lớp t-chuẩn có ngưỡng đồng dạng 1, 2. Tiếp theo, chúng ta sẽ nghiên cứu một số tính chất về tự đẳng cấu. Định nghĩa 2.2.5. Xét f thuộc Aut(J) f gọi là tự đẳng cấu của t-chuẩn t nếu và chỉ nếu f(t(x,y)) = t(f(x),f(y)) với mọi x,y. f gọi là tự đẳng cấu của t-chuẩn có ngưỡng T nếu và chỉ nếu f(T(x,y,α) = T(f(x),f(y),f(α)). f gọi là tự đẳng cấu của lớp các t-chuẩn có ngưỡng đồng dạng nếu và chỉ nếu = {T(x,y,α) : α [0,1]2} = {f-1(T(f(x),f(y),α’) : α’ [0,1]2} Ký hiệu Aut(J,t) là tập các tự đẳng cấu của t. Aut(J,T) là tập các tự đẳng cấu của T. Aut(J,) là tập các tự đẳng cấu của . Trên Aut(J), xác định phép toán hợp thành. Từ [28] ta đã biết Aut(J) cùng với phép toán hợp thành lập thành một nhóm. Từ [12], ta có Aut(J,T) là nhóm con của Aut(J). Kết hợp với mệnh đề 2.2.21 ta có kết quả sau: Mệnh đề 2.2.22. Aut(J,) là nhóm con của Aut(J,T). Dựa trên mệnh đề 2.2.21 và mệnh đề 2.2.22, ta có kết quả sau: Hệ quả 2.2.23. Aut(J,t1) Aut(J,t2) Aut(J,T) Aut(J,t1) Aut(J,t2) = Aut(J,) Sau đây, ta sẽ nhắc lại một số kết quả trong [28] cũng như mở rộng của chúng cho t-chuẩn có ngưỡng. Chú ý rằng, từ đây về sau, trong các phát biểu về hàm sinh, nếu không có chú thích gì, chúng tôi chỉ đề cập đến các hàm sinh nhân tính. Định lý 2.2.24[28]. Cho tf và tg là hai t-chuẩn chặt, thế thì tập các đẳng cấu giữa chúng là g-1R+f. Hệ quả 2.2.25. Cho và là hai lớp t-chuẩn có ngưỡng đồng dạng chặt, thế thì tập các đẳng cấu giữa chúng là g1-1R+f1 g2-1R+f2. Mệnh đề 2.2.26[28]. Cho t là t-chuẩn liên tục, thế thì Aut(J,t) = f-1R+f, với f Aut(J) nào đó nếu và chỉ nếu t là t-chuẩn chặt. Hệ quả 2.2.27. Cho là lớp các t-chuẩn có ngưỡng đồng dạng liên tục, thế thì Aut(J,) = f1-1R+f1 f2-1R+f2 với f1, f2 Aut(J) nào đó, nếu và chỉ nếu là lớp các t-chuẩn có ngưỡng đồng dạng chặt. Định lý 2.2.28[28]. Cho tf, tg là t-chuẩn nilpotent. r > 0, sao cho g(0) = fr(0). Khi đó g-1rf là đẳng cấu duy nhất giữa tf và tg. Hệ quả 2.2.29. Cho và là hai lớp t-chuẩn có ngưỡng đồng dạng nilpotent đẳng cấu với nhau khi và chỉ khi tồn tại r1, r2 > 0 sao cho g1(0) = (0) và g2(0) = (0), đồng thời g1-1r1f1 = g2-1r2f2. Khi đó g1-1r1f1 là đẳng cấu duy nhất. Hệ quả 2.2.30. Cho và là hai lớp t-chuẩn có ngưỡng đồng dạng hỗn hợp là đẳng cấu với nhau khi và chỉ khi tồn tại r1, r2 > 0 sao cho g2(0) = (0), đồng thời g1-1r1f1 = g2-1r2f2. Khi đó g2-1r2f2 là đẳng cấu duy nhất. Định lý 2.2.31[28]. Cho t là t-chuẩn nilpotent. Khi đó Aut(J,t) = {1}. Hệ quả 2.2.32. Cho là lớp các t-chuẩn có ngưỡng đồng dạng nilpotent (hỗn hợp). Khi đó Aut(J,) = {1}. t-đối chuẩn có ngưỡng và bộ ba De Morgan có ngưỡng Cho s1, s2 là t-đối chuẩn sao cho s1(x,y) ≤ s2(x,y) với mọi x, y thuộc [0,1], β là ngưỡng, nghĩa là β = (βx,βy), khi đó t-đối chuẩn có ngưỡng được định nghĩa như sau. Định nghĩa 2.2.6[9]. t-đối chuẩn có ngưỡng S(x,y,β) được xác định trên [0,1]×[0,1] như sau: S(x,y,β) = Định nghĩa 2.2.7. = là lớp các t-đối chuẩn có ngưỡng đồng dạng. Tương tự như đối với t-chuẩn, t-đối chuẩn có ngưỡng cũng được gọi là t-đối chuẩn liên tục, Archimedean, chặt, nilpotent, hỗn hợp theo các tính chất của s1, s2. Phần tiếp theo, chúng ta sẽ khảo sát tính đối ngẫu của t-chuẩn và t-đối chuẩn có ngưỡng, trước hết, ta có các kết quả sau. Mệnh đề 2.2.33[19]. Cho t1 ≤ t2, khi đó s1(x,y) = n(t1(n(x),n(y))) ≥ s2(x,y) = n(t2(n(x),n(y))) với n là phép phủ định chặt. Mệnh đề trên cũng là cơ sở cho việc xây dựng t-đối chuẩn có ngưỡng từ t-chuẩn có ngưỡng. Mệnh đề 2.2.34. S(x,y,β) là t-đối chuẩn có ngưỡng khi đó tồn tại t-chuẩn có ngưỡng T(x,y,α) và hàm phủ định chặt n sao cho β = n(α), và S(x,y,β) = n(T(n(x),n(y),α)) và ngược lại. là lớp các t-đối chuẩn có ngưỡng đồng dạng nếu và chỉ nếu tồn tại là lớp các t-chuẩn có ngưỡng đồng dạng sao cho = {n(T(n(x),n(y),α)) : α [0,1]2} và ngược lại. Chứng minh của mệnh đề là đơn giản dựa vào định lý 2.1.2, với chú ý là khi n(x) ≥ αx thì x ≤ n(αx) = βx, tương tự cho αy và βy, và khi αx, αy biến thiên từ 0 tới 1 thì βx = n(αx) và βy = n(αy) biến thiên từ 1 tới 0, tương ứng. S và T, và được gọi là đối ngẫu với nhau qua phủ định chặt n. Từ [28], ta đã biết, các t-đối chuẩn Archimedean có thể được biểu diễn thông qua hàm đối sinh nhân tính g là song ánh giảm từ [0,1] vào [b,1] dạng: sg(x,y) = g-1(g(x)g(y) b), với g = fn, trong đó f là hàm sinh nhân tính của t-chuẩn t là đối ngẫu của s qua phủ định chặt n. Tương tự, lớp các t-đối chuẩn Archimedean đồng dạng có thể được biểu diễn thông qua cặp hàm đối sinh (g1,g2) với g1 = f1n, g2 = f2n, trong đó (f1,f2) là cặp hàm sinh của là lớp các t-đối chuẩn có ngưỡng đồng dạng đối ngẫu của qua phủ định chặt n. Sau đây là kết quả về đẳng cấu giữa các t-đối chuẩn có ngưỡng. Mệnh đề 2.2.35. Cho T1, T2 là hai t-đối chuẩn có ngưỡng đẳng cấu với nhau thông qua hàm f. S1, S2 là hai t-đối chuẩn đối ngẫu với T1, T2 qua các phủ định chặt n1, n2 tương ứng. Khi đó S1, S2 đẳng cấu với nhau thông qua n2fn1. Chứng minh: Thật vậy, dựa vào định nghĩa và mệnh đề 2.2.34, ta có : n2(f(n1(S1(x,y,β1)))) = n2(f(T1(n1(x),n1(y),n1(β1)))) = n2(f(T1(n1(x),n1(y),α1))) = n2(T2(f(n1(x)),f(n1(y)),f(α1))) = n2(T2(f(n1(x)),f(n1(y)),α2)) = S2(n2(f(n1(x))),n2(f(n1(y))),n2(α2)) = S2(n2(f(n1(x))),n2(f(n1(y))),β2) □. Hệ quả 2.2.36. Cho 1, 2 là hai lớp t-chuẩn có ngưỡng đồng dạng đẳng cấu với nhau thông qua hàm f. 1, 2 là đối ngẫu với 1, 2 qua các phủ định chặt n1, n2 tương ứng, thế thì 1, 2 là đẳng cấu với nhau thông qua n2fn1. Định nghĩa 2.2.8. Bộ ba (T,S,n) với T là t-chuẩn có ngưỡng, S là t-đối chuẩn có ngưỡng đối ngẫu với T qua phủ định chặt n được gọi là bộ ba De Morgan có ngưỡng. Tập (,,n) = {(T(x,y,α),S(x,y,β),n) : α = n(β), α [0,1]2} được gọi là lớp các bộ ba De Morgan có ngưỡng đồng dạng. Các bộ ba De Morgan có ngưỡng cũng được gọi là liên tục, Archimedean, chặt, nilpotent nếu t-chuẩn có ngưỡng T là liên tục, Archimedean, chặt, nilpotent tương ứng. Lớp các bộ ba De Morgan có ngưỡng đồng dạng Archimedean, cũng có thể được biểu diễn thông qua các cặp hàm sinh đối với t-chuẩn có ngưỡng, hàm sinh._. đối với phép phủ định và cặp hàm đối sinh ứng với t-đối chuẩn có ngưỡng dạng: (,ηg,). Sau đây, chúng ta xét đẳng cấu giữa các bộ ba De Morgan có ngưỡng. Cho q thuộc Aut(J). Định nghĩa 2.2.9. q gọi là đẳng cấu giữa hai bộ ba De Morgan có ngưỡng (T1,S1,n1) và (T2,S2,n2) nếu và chỉ nếu q là đẳng cấu giữa T1, T2, giữa S1, S2 và giữa n1, n2. q gọi là đẳng cấu giữa hai lớp (1,1,n1) và (2,2,n2) nếu và chỉ nếu q là đẳng cấu giữa 1, 2, giữa 1, 2, giữa n1, n2. Ta xét mệnh đề 2.2.35, và hệ quả 2.2.36, xét trường hợp f = n2fn1, nghĩa là f(n1(x)) = n2(f(x)), hay n1 và n2 đẳng cấu với nhau qua hàm f. Như thế, nếu q là đẳng cấu giữa T1, T2 và giữa n1, n2 thì q cũng là đẳng cấu giữa S1, S2. Tương tự, nếu q là đẳng cấu giữa 1, 2 và giữa n1, n2 thì q cũng là đẳng cấu giữa 1, 2. Như thế, khi xét các bộ ba De Morgan có ngưỡng, ta chỉ cần xét t-chuẩn và phủ định, tương tự như trong [28], ta cũng gọi (T,n) với T là t-chuẩn có ngưỡng là hệ De Morgan có ngưỡng, và (,n) là lớp các bộ ba De Morgan có ngưỡng đồng dạng. Định lý 2.2.37.[28]: Cho (tf,ηg) và (tu,ηv) là hai hệ De Morgan đẳng cấu với nhau nếu và chỉ nếu (tu,ηv) = (tfh,ηgh) với h Aut(J) nào đó, khi đó h-1 là đẳng cấu duy nhất giữa chúng. Từ định lý 2.2.37. và mệnh đề 2.2.21, ta có: Hệ quả 2.2.38. Cho (,ηg) và (,ηv) là hai lớp các hệ De Morgan có ngưỡng đồng dạng Archimedean đẳng cấu với nhau nếu và chỉ nếu (,,ηv) = (,,ηgh) với h Aut(J) nào đó, khi đó h-1 là đẳng cấu duy nhất giữa chúng. Từ [28], ta có kết quả sau về tính không duy nhất của phép phủ định đối với hai t-chuẩn và t-đối chuẩn đối ngẫu với nhau. Bổ đề 2.2.39[28]. Cho (t,s,n1) và (t,s,n2) là hai bộ ba De Morgan có cùng t-chuẩn và t-đối chuẩn, khi đó n1n2 Aut(J,t). Kết hợp với hệ quả 2.2.23 và mệnh đề 2.2.34., ta có các kết quả sau. Hệ quả 2.2.40. Nếu (,,n1) và (,,n2) là hai lớp các bộ ba De Morgan có ngưỡng đồng dạng có cùng lớp các t-chuẩn có ngưỡng đồng dạng và t-đối chuẩn có ngưỡng đồng dạng, khi đó n1n2 Aut(J,). Hệ quả 2.2.41. Nếu (,,n1) và (,,n2) là hai lớp các bộ ba De Morgan có ngưỡng đồng dạng nilpotent hay hỗn hợp thì n1 = n2. Kéo theo có ngưỡng Tương tự như đối với t-chuẩn và t-đối chuẩn. Ta cũng có định nghĩa về kéo theo có ngưỡng dựa trên hai phép kéo theo i1(x,y) ≤ i2(x,y) với mọi x,y [0,1] và ngưỡng γ. Định nghĩa 2.2.10. Kéo theo có ngưỡng γ = (γx,γy) được xác định: I(x,y,γ) = Ta dễ dàng kiểm chứng được rằng hàm kéo theo có ngưỡng cũng là hàm kéo theo. Sau đây, chúng ta sẽ xét một số kết quả về hàm kéo theo làm tiền đề cho việc tạo phép kéo theo mờ có ngưỡng từ các toán tử mờ khác. Mệnh đề 2.2.42[19]. Cho s1 và s2 là hai t-đối chuẩn sao cho s1(x,y) ≤ s2(x,y), khi đó i1(x,y) = s1(n(x),y) ≤ i2(x,y) = s2(n(x),y). Mệnh đề 2.2.43[19]. Cho t1 và t2 là hai t-đối chuẩn sao cho t1(x,y) ≥ t2(x,y), khi đó i1(x,y) = supz(t1(x,z) ≤ y) ≤ i2(x,y) = supz(t2(x,z) ≤ y). Mệnh đề 2.2.44[28]. Cho t là t-chuẩn nilpotent, khi đó t có thể biểu diễn dưới dạng t(x,y) = g-1(g(x) + g(y) - 1 0) với g Aut(J) nào đó. g được gọi là hàm L-sinh của t. Ta đã biết, phủ định mạnh có thể được tạo ra từ hàm η(x) = 1 - x và hàm sinh. Bên cạnh đó, ta còn có một cách khác để xây dựng phép phủ định dựa vào hàm L-sinh của các t-chuẩn nilpotent [28]. Mệnh đề 2.2.45[28]. Cho t là t-chuẩn nilpotent có hàm L-sinh g, khi đó ηg(x) = g-1(1-g(x)) là phủ định chặt và được gọi là phủ định tự nhiên của t. Đặc biệt, t-chuẩn nilpotent, và t-đối chuẩn đối ngẫu qua phép phủ định tự nhiên sẽ tạo ra cùng một phép kéo theo. Mệnh đề 2.2.46. Cho t là t-chuẩn nilpotent có hàm L-sinh g, s là t-đối chuẩn đối ngẫu với t qua phủ định tự nhiên ηg, khi đó it(x,y) = supz(t(x,z) ≤ y) = is(x,y) = s(ηg(x),y). Chứng minh: Thật vậy, ta có: is(x,y) = s(ηg(x),y) = ηg(t(x,ηg(y)) = g-1(1-g(t(x,g-1(1-g(y)))) = g-1(1-g(g-1(g(x)+g(g-1(1-g(y))))-10)) = g-1(1-(g(x)-g(y)0)) = g-1(min(1-g(x)+g(y),1)) Trong khi đó: it(x,y) = supz(t(x,z) ≤ y) = supz(g-1(g(x)+g(z)-1) ≤ y) = supz(g(x)+g(z)-1 ≤ g(y)) = supz(g(z) ≤ 1-g(x)+g(y)) = g-1(min(1-g(x)+g(y),1)). Vậy, ta có đpcm □. Các toán tử mờ tham số Trong phần này chúng ta sẽ tiến hành khảo sát tính chất giải tích, quan trọng nhất là tính chất thứ tự của một số họ toán tử mờ tham số kinh điển nhằm làm tiền đề cho việc xây dựng các toán tử mờ có ngưỡng tham số. Ta chú ý rằng, khi xác định một t-chuẩn có ngưỡng, ta cần xác định hai t-chuẩn thành phần t1, t2 thoả t1(x,y) ≥ t2(x,y). Trước hết, chúng ta đã có các kết quả về so sánh giữa hai t-chuẩn thông qua các hàm sinh và hàm đối sinh của chúng (định lý 2.2.5 và 2.2.6), giữa hai t-đối chuẩn thông qua t-chuẩn đối ngẫu tương ứng (mệnh đề 2.2.33), giữa hai phép kéo theo xây dựng từ t-chuẩn (mệnh đề 2.4.42), giữa hai phép kéo theo xây dựng từ t-đối chuẩn (mệnh đề 2.4.43). Bên cạnh đó, ta có các kết quả bổ sung sau. Mệnh đề 2.2.47. Cho f Aut(J), khi đó t1(x,y) = f-1(f(x)f(y)) ≥ t2(x,y) = f-1(f(x)+f(y)-1 0). Chứng minh: Ta có f(x),f(y) ≤ 1, vậy (1-f(x))(1-f(y)) ≥ 0, do đó f(x)f(y) ≥ f(x)+f(y)-1, ta có đpcm □. Nghĩa là, cho f Aut(J), t1 là t-chuẩn nilpotent với f là hàm L-sinh, t2 là t-chuẩn chặt với f là hàm sinh nhân tính, thế thì t1 ≤ t2. Định lý 2.2.5 và 2.2.6 cho ta điều kiện cần và đủ khi so sánh hai t-chuẩn Archimedean liên tục, tuy nhiên, bên cạnh các điều kiện này, chúng ta còn có các điều kiện đủ khác là hệ quả của hai định lý này, mà trong nhiều trường hợp tỏ ra rất hữu dụng khi xác định các t-chuẩn có ngưỡng [34]. Hệ quả 2.2.48[34]. Cho t1, t2 là hai t-chuẩn Archimedean liên tục với các hàm sinh cộng tính tương ứng g1, g2 : [0,1] → [0,∞]. Khi đó, t1 ≤ t2 nếu một trong các điều kiện sau thoả mãn: Hàm g1○g2-1 : [0,g2(0)] → [0,∞] là lõm. Hàm f : (0,g2(0)] → [0,∞] f(x) := là không tăng Hàm  : (0,1) → [0,∞] là không giảm. Kết hợp với mệnh đề 2.2.4, khi thay hàm sinh cộng tính g(x) bằng hàm sinh nhân tính f(x) = e-g(x), ta có kết quả sau. Hệ quả 2.2.49. Cho t1, t2 là hai t-chuẩn với hàm sinh nhân tính f1, f2 : [0,1] → [0,1]. Khi đó t1 ≤ t2 nếu điều kiện sau thoả mãn Hàm g: g(x) := là không giảm. Sau đây chúng ta sẽ tiến hành khảo sát một số họ toán tử mờ tham số và việc tạo ra các toán tử mờ có ngưỡng từ chúng. Định nghĩa 2.2.11 [28]. Họ Dombi t-chuẩn : r > 0 phủ định 1-x hàm sinh cộng tính : r > 0 Mệnh đề 2.2.50. Họ t-chuẩn Dombi là đơn điệu không giảm theo r. Chứng minh: Thực vậy, xét t1, t2 là hai t-chuẩn thuộc họ với các hàm sinh cộng tính: g1(x) = và g2(x) = tương ứng Ta có: g2-1(x) = , nghĩa là f(x) = = . Giả sử r1 ≤ r2, khi đó f(x) là không giảm theo f(x). Nghĩa là t1 ≤ t2 theo hệ quả 2.2.48, ta có đpcm □. Định nghĩa 2.2.12 [28]. Họ Jane Doe #1-Hamacher t-chuẩn  : a > 0, r > 0 phủ định  : a > 0 hàm sinh cộng tính -ln : a > 0, r > 0 Mệnh đề 2.2.51. Họ t-chuẩn Jane Doe #1-Hamacher là đơn điệu không tăng theo a, đơn điệu không giảm theo r. Chứng minh: Rõ ràng họ t-chuẩn Jane Doe #1-Hamacher là đơn điệu không tăng theo a dựa vào công thức định nghĩa của họ tham số. Xét t1, t2 là hai t-chuẩn thuộc họ với các hàm sinh cộng tính g1(x) = -ln và g2(x) = tương tứng. Ta có f(x) = = , giả sử r1 < r2, khi đó f là không giảm x, vậy t1 ≤ t2 theo hệ quả 2.2.48, ta có đpcm □. Định nghĩa 2.2.13. [28]. Họ Aczél-Alsina t-chuẩn  : r > 0 phủ định hàm sinh cộng tính (-lnx)r : r > 0 Mệnh đề 2.2.52. Họ t-chuẩn Aczél-Alsina là đơn điệu không giảm theo r Chứng minh: Xét t1, t2 là hai t-chuẩn thuộc họ với các hàm sinh cộng tính g1(x) = và g2(x) = tương ứng. Ta có g2-1(x) = f(x) = = . Giả sử r1 ≤ r2, khi đó f(x) không tăng theo x, nghĩa là t1 ≤ t2 theo hệ quả 2.2.48, ta có đpcm □. Định nghĩa 2.2.14 [28]. Họ Frank t-chuẩn loga : a > 0, a ≠ 1; xy : a = 1 phủ định 1-x hàm sinh nhân tính  : a > 0, a ≠ 1; x : a = 1 Mệnh đề 2.2.53[34]. Họ t-chuẩn Frank là đơn điệu không tăng theo tham số a. Định nghĩa 2.2.15 [28]. Họ Schweizer t-chuẩn  : a ≠ 0; xy : a = 0 phủ định 1-x  phủ định tự nhiên : a > 0 hàm sinh cộng tính xa-1 : a 0; -lnx : a = 0 Mệnh đề 2.2.54. Họ t-chuẩn Schweizer là đơn điệu không tăng theo tham số a. Chứng minh: Xét hai t-chuẩn t1, t2 thuộc họ với hai hàm sinh cộng tính tương ứng là g1, g2, ta xét các trường hợp sau: g1(x) = -1, g2(x) = -1, a2 < a1 < 0 hoặc 0 < a2 < a1 Ta có f(x) = = là hàm không giảm, vậy t1 ≤ t2 theo hệ quả 2.2.48. g1(x) = -lnx, g2(x) = xa-1, a < 0 Ta có f(x) = = -x-a là hàm không giảm, vậy t1 ≤ t2 theo hệ quả 2.2.48. g1(x) = 1-xa, g2(x) = -lnx, a > 0 Ta có f(x) = = axa là hàm không giảm, vậy t1 ≤ t2 theo hệ quả 2.2.48. Ta có đpcm □. Định nghĩa 2.2.16 [28]. Họ Jane Doe #2 t-chuẩn xye-alnxlny : a > 0; xy : a = 0 phủ định 1-x hàm sinh nhân tính Dựa vào công thức định nghĩa của họ, ta có kết quả sau. Mệnh đề 2.2.55. Họ t-chuẩn Jane Doe #2 là đơn điệu không tăng theo tham số a. Định nghĩa 2.2.17 [28]. Họ Jane Doe #3 t-chuẩn 1- : a > 0 phủ định 1-x hàm sinh nhân tính 1-(1-x)a : a > 0 Đạo hàm công thức t-chuẩn theo tham số a, ta có kết quả sau. Mệnh đề 2.2.56. Họ t-chuẩn Jane Doe #3 là đơn điệu không tăng theo tham số a. Định nghĩa 2.2.18[28]. Họ Yager t-chuẩn 1- : a > 0 phủ định tự nhiên 1- : a > 0 hàm sinh cộng tính (1-x)a Mệnh đề 2.2.57. Họ t-chuẩn Yager là đơn điệu không giảm theo tham số a Chứng minh: Xét hai t-chuẩn t1, t2 thuộc họ với hai hàm sinh cộng tính: g1(x) = và g2(x) = 0 < a1 < a2 Ta có f(x) = = là hàm không giảm, vậy t1 ≤ t2 theo hệ quả 2.2.48, ta có đpcm □. Định nghĩa 2.2.19[28]. Họ Jane Doe #4 t-chuẩn : a > 0 phủ định tự nhiên : a > 0, a ≠ 1; 1-x : a = 1 hàm sinh cộng tính 1-loga((a-1)x+1) : a > 0, a ≠ 1; 1-x : a = 1 Mệnh đề 2.2.58. Họ Jane Doe #4 là đơn điệu không giảm theo tham số a Chứng minh: Xét hai t-chuẩn t1, t2 thuộc họ với hai hàm sinh cộng tính g1, g2 tương ứng, ta xét các trường hợp sau g1(x) = 1-((a1-1)x+1) và g2(x) = 1-((a2-1)x+1), với a1 < a2 < 1 hoặc 1 < a1 < a2 Ta có f(x) = = là hàm không giảm, vậy t1 ≤ t2, theo mệnh đề 2.2.48. g1(x) = 1-x và g2(x) = 1-loga((a-1)x+1) : a > 1. Ta có f(x) = = ((a-1)x+1) là hàm không giảm, vậy t1 ≤ t2, theo mệnh đề 2.2.48. g1(x) = 1-loga((a-1)x+1) và g2(x) = 1 - x : a < 1 Ta có f(x) = = là hàm không giảm, vậy t1 ≤ t2, theo mệnh đề 2.2.48. Ta có đpcm □. Định nghĩa 2.2.20 [28]. Họ Weber t-chuẩn (a(x+y-1)-(a-1)xy) 0 : a > 0 phủ định tự nhiên  : a > 0, a ≠ 1; 1-x : a = 1 hàm sinh cộng tính loga((a-1)(1-x)+1) : a > 0, a ≠ 1; 1-x : a = 1 Mệnh đề 2.2.59. Họ t-chuẩn Weber là đơn điệu không tăng theo tham số a Chứng minh: Xét hai t-chuẩn t1, t2 thuộc họ với hai hàm sinh cộng tính g1(x), g2(x) tương ứng, ta xét các trường hợp sau: g1(x) = ((a1-1)(1-x)+1) và g2(x) = ((a2-1)(1-x)+1), với a1 > a2 > 1 hoặc 1 > a1 > a2 Ta có f(x) = = là hàm không giảm, vậy t1 ≤ t2 theo mệnh đề 2.2.48. g1(x) = 1-x và g2(x) = loga((a-1)(1-x)+1) : a < 1 Ta có f(x) = = là hàm không giảm, vậy t1 ≤ t2 theo mệnh đề 2.2.48. g1(x) = loga((a-1)(1-x)+1) : a > 1 và g2(x) = 1 - x Ta có f(x) = = là hàm không giảm, vậy t1 ≤ t2 theo mệnh đề 2.2.48. Ta có đpcm □. Định nghĩa 2.2.21 [28]. Họ Jane Doe #6 t-chuẩn loga: a > 0, a ≠ 1; (x+y-1 0), a = 1 phủ định tự nhiên loga(a-ax+1) hàm sinh cộng tính 1- Mệnh đề 2.2.60. Họ t-chuẩn Jane Doe #6 đơn điệu không tăng theo tham số a Chứng minh: Xét hai t-chuẩn t1, t2 với các hàm sinh cộng tính g1(x) = 1- và g2(x) = 1- tương ứng với a2 < a1; a1, a2 ≠ 1 Ta có f(x) = = không giảm theo x, vậy ta có t1 ≤ t2 theo hệ quả 2.2.48. Sau đây, chúng ta sẽ khảo sát các so sánh giữa một số cặp họ t-chuẩn với cùng tham số. Mệnh đề 2.2.61. Cho t1 là t-chuẩn Yager và t2 là t-chuẩn Schweizer với cùng tham số a > 0, thế thì: t1 ≥ t2 : a > 1 t1 ≤ t2 : a < 1 Chứng minh: Giả sử t1 là t-chuẩn Yager với hàm sinh cộng tính g1(x) = (1-x)a, t2 là t-chuẩn Schweizer với hàm sinh cộng tính g2(x) = 1-xa, ta có: f(x) = = là hàm không giảm khi a < 1, vậy ta có t1 ≤ t2 theo hệ quả 2.2.48 □. h(x) = = là hàm không giảm khi a > 1, vậy ta có t2 ≤ t1 theo hệ quả 2.2.48 □. Mệnh đề 2.2.62. Cho t1 là t-chuẩn Weber, t2 là t-chuẩn Jane Doe #4, với cùng tham số a, thế thì: t1 ≤ t2 : a > 1 t1 ≥ t2 : a < 1 Chứng minh: Giả sử t1 là t-chuẩn Weber với hàm sinh cộng tính g1(x) = loga((a-1)(1-x)+1), t2 là t-chuẩn Jane Doe #4 với hàm sinh cộng tính g2(x) = 1-loga((a-1)x+1), ta có: f(x) = = là hàm không giảm khi a > 1, vậy ta có t1 ≤ t2 theo hệ quả 2.2.48. □. h(x) = = là hàm không giảm khi a < 1, vậy ta có t2 ≤ t1 theo hệ quả 2.2.48 □. Từ [28], ta có họ t-chuẩn Jane Doe #3 có hàm sinh 1-(1-x)a, họ Yager có hàm L-sinh 1-(1-x)a, họ Frank có hàm sinh , họ Jane Doe #6 có hàm L-sinh . Theo mệnh đề 2.2.47, ta có các kết quả sau. Mệnh đề 2.2.63. Cho t1 là t-chuẩn Jane Doe #3, t2 là t-chuẩn Yager có cùng tham số a, khi đó t1 ≥ t2. Mệnh đề 2.2.64. Cho t1 là t-chuẩn Frank, t2 là t-chuẩn Jane Doe #6 có cùng tham số a, khi đó t1 ≥ t2. Mệnh đề 2.2.65[39]. Xét hai t-chuẩn sau: t-chuẩn min tm(x,y) = min(x,y) t-chuẩn z tz(x,y) = Thế thì, với mọi t-chuẩn, ta luôn có tm(x,y) ≥ t(x,y) ≥ tz(x,y). Kết luận Trong chương này chúng tôi đã tổng kết lại các nghiên cứu về toán tử mờ có ngưỡng. Các khảo sát về cặp hàm sinh sẽ được sử dụng trong việc tạo ra các toán tử mờ có ngưỡng tham số. Các xem xét giải tích về các họ toán tử mờ tham số ở cuối chương là tổng kết các tính chất về thứ tự của các toán tử này và có thể sử dụng để tạo ra các t-chuẩn có ngưỡng tham số. LUẬT KẾT HỢP MỜ Chương này tóm tắt lại một số khái niệm cơ bản của bài toán luật kết hợp mờ, khảo sát sơ lược một số vấn đề về không gian tìm kiếm, việc sử dụng các toán tử mờ và toán tử mờ có ngưỡng trong bài toán tìm luật kết hợp mờ. Chúng tôi cũng đưa ra thuật toán F-Apriori để giải bài toán tìm luật kết hợp mờ. Giới thiệu Sự phát triển của công nghệ thông tin, công nghệ về thu nhận, lưu trữ và phân phối dữ liệu đã dẫn tới sự bùng nổ về thông tin và dữ liệu. Thách thức lớn nhất đối với các tổ chức cũng như các cá nhân ngày nay không chỉ là ở việc có ngày càng nhiều dữ liệu càng tốt mà còn ở việc trích rút từ kho dữ liệu khổng lồ thu nhận được ra các tri thức hữu ích. Vấn đề này đã tập hợp nhiều nhà nghiên cứu thuộc nhiều lĩnh vực khác nhau như thống kê, máy học, cơ sở dữ liệu, … vào một lĩnh vực nghiên cứu mới, đó là khai phá dữ liệu (Data Mining). Khai phá dữ liệu thường được xét đến như là một khâu trong một quá trình lớn hơn đó là Phát hiện tri thức trong cơ sở dữ liệu (Knowledge discovery in databases-KDD) [17]. Bài toán này bao gồm: Tìm hiểu về lĩnh vực ứng dụng, các tri thức đã có trước đó, và mục tiêu của người sử dụng. Lựa chọn loại tập dữ liệu tiến hành quá trình phát hiện tri thức, thực hiện công tác chuẩn hoá và chuyển đổi dữ liệu nếu cần. Lựa chọn hình thức khai phá dữ liệu, giải thuật, và quyết định mô hình cũng như các tham số có thể có. Thực hiện quá trình khái phá dữ liệu, trích ra các mẫu và mô hình. Hiển thị, diễn giải và hợp nhất các tri thức được phát hiện. Quá trình này được tiến hành lặp đi lặp lại do một bước có thể dẫn đến những sửa đổi của bước đã được tiến hành trước đó. Quá trình lặp cũng do người dùng có thể giới hạn lại khối lượng công việc của hệ thống trong phạm vi mà anh ta thực sự quan tâm. Bước khai phá dữ liệu là công việc trích rút các thông tin, một cách tự động từ dữ liệu. Các thông tin này có thể có giá trị đối với người sở hữu kho dữ liệu. Định nghĩa vắn tắt về thao tác này được đưa ra trong [24]: Khai phá dữ liệu là phân tích tập dữ liệu (thường là lớn, thậm chí rất lớn) thu nhận được nhằm tìm kiếm các mối quan hệ chắc chắn và tổng hợp dữ liệu theo một hình thức mới để trở nên hiểu được và hữu dụng đối với chủ của dữ liệu. Để phân tích dữ liệu, một vài dạng công việc khác nhau đã được phân biệt, tương ứng với mục tiêu của quá trình phân tích, và quan trọng hơn là tương ứng với sản phẩm dự kiến. Những công việc này có thể được phân loại như sau [24]. Phân tích dữ liệu thăm dò. Mục đích là thăm dò dữ liệu mà không hề có một ý tưởng rõ ràng về mục tiêu tìm kiếm. Các kỹ thuật thông thường gồm có hiển thị đồ hoạ, chiếu và tóm tắt. Tìm kiếm theo nội dung. Người dùng có một mẫu riêng trong ý nghĩ và muốn tìm kiếm những mẫu tương tự trong tập dữ liệu. Công việc này thường được sử dụng nhiều nhất để thu nhận thông tin từ một tập lớn dữ liệu văn bản và hình ảnh. Thách thức chính ở đây là định nghĩa sự tương tự và tìm kiếm các mẫu tương tự dựa theo định nghĩa này. Một ví dụ nổi tiếng là máy tìm kiếm Google (http: //www.google.com) của Brin và Page [6], cho phép tìm kiếm trang web chứa đựng thông tin tương tự như tập các từ khoá do người dùng nhập vào. Mô tả mô hình. Phương pháp mô tả mô hình tìm cách mô tả tất cả dữ liệu thu nhận được. Các phương pháp mô tả thông thường bao gồm một vài mô hình thống kê, phân cụm và mô hình phụ thuộc. Dự đoán mô hình. Kỹ thuật dự đoán như phân loại và hồi quy tìm cách trả lời câu hỏi dựa trên việc kiểm tra các tri thức đã có và các câu trả lời nhằm mục đích tổng quát hoá chúng cho các trường hợp tương lai. Một ví dụ ấn tượng của thao tác phân lớn là hệ thống SKICAT của Fayyad et al. [16], có thể tiến hành công tác phân lớp các ngôi sao và thiên hà tương đương với một chuyên gia. Hệ thống này của họ được sử dụng tại NASA nhằm phân lớp tự động hàng triệu ngôi sao và thiên hà từ những bức ảnh chụp bầu trời. Phát hiện mẫu. Mục đích là tìm các mẫu xuất hiện thường xuyên trong cơ sở dữ liệu. Rất nhiều thuật toán đã được nghiên cứu cho các loại mẫu khác nhau như các tập [2], cấu trúc cây [42], cấu trúc đồ thị [37,30], hay cấu trúc quan hệ bất kỳ [15,21] và luật kết hợp trên những cấu trúc này. Dạng mẫu được nghiên cứu nhiều nhất là tập các mục dữ liệu xuất hiện cùng nhau trong các cơ sở dữ liệu, ví dụ lưu trữ của các hoá đơn bán lẻ. Một ứng dụng tiêu biểu của luật kết hợp là trong ứng dụng bán hàng [5]. Trong những năm gần đây, đã có một vài cuốn sách và nhiều nghiên cứu được xuất bản về lĩnh vực này, chúng tôi có thể kể ra ở đây [24,26,29]. Luật kết hợp được giới thiệu lần đầu tiên trong [2]. Xuất phát từ bài toán bán hàng siêu thị, theo đó, chúng ta có một cơ sở dữ liệu “lớn” các giao dịch của khách hàng. Siêu thị của chúng ta có một lượng lớn các chủng loại mặt hàng, vấn đề đặt ra đối với nhà quản lý siêu thị là cần quyết định nên bán những mặt hàng nào, những mặt hàng nào nên đặt cạnh nhau, tóm lại là cách thức bày các mặt hàng trên các giá hàng nhằm thu lợi nhuận lớn nhất. Một phương pháp tiếp cận chủ yếu là sử dụng cơ sở dữ liệu về các giao dịch đã có trong quá khứ. Thông thường, người ta sẽ tiến hành xem xét các dữ liệu tích luỹ về một khoảng thời gian bán hàng như một năm, một tháng, một tuần hay một ngày, được lưu trữ trên máy tính. Hiện nay, với công nghệ sử dụng mã vạch, ta có thể theo dõi được trong một giao dịch, có cụ thể những mặt hàng nào. Thậm chí, chúng ta có thể theo dõi không chỉ các mặt hàng trong từng giao dịch mà còn cả các mặt hàng trong một khoảng thời gian như đối với khác hàng là một câu lạc bộ sách hay âm nhạc. Bài toán tìm luật kết hợp đầu tiên được đưa ra nhằm giải quyết việc tìm những mối liên hệ “có ý nghĩa” giữa các mặt hàng trong các giao dịch được biểu diễn dưới dạng các chuỗi nhị phân biểu thị việc có hay không có của từng mặt hàng trong giao dịch. Các luật này có thể cho biết rằng, mọi người khi mua bơ và sữa thường sẽ mua cả bánh mì, rõ ràng những hiểu biết dạng này rất có ý nghĩa đối với nhà quản lý của siêu thị. Ví dụ cho luật này có thể là như sau: “90% số người mua bơ và sữa sẽ mua cả bánh mì” và “30% số người vào siêu thị sẽ mua bơ, sữa và bánh mì.” Như thế, người quản lý có thể xem xét việc xếp bơ, sữa và bánh mì ở cạnh nhau nhằm tạo sự tiện dụng cho khác hàng. Hay, cũng có thể xem xét việc tăng cường bán bơ, sữa để có thể tăng lượng bánh mì bán được. Một cách hình thức, có thể xem đây là bài toán tìm mối liên hệ giữa các giá trị “1” trong cơ sở dữ liệu quan hệ mà các thuộc tính đều có dạng Boolean. Bảng trong cơ sở dữ liệu này có một thuộc tính tương ứng với mỗi mặt hàng và mỗi một bản ghi tương ứng với một giao dịch. Giá trị của một thuộc tính đối với một bản ghi cho trước là “1” nếu mặt hàng tương ứng có trong giao dịch tương ứng và “0” nếu ngược lại. Trong [40], bài toán này được gọi là bài toán luật kết hợp Boolean. Một mở rộng của bài toán này chính là bài toán tìm các luật kết hợp lượng hoá được nêu ra trong [40]. Trong [40] chỉ ra rằng, hầu hết các cơ sở dữ liệu khoa học hay kinh doanh, các thuộc tính thường có khả năng diễn đạt cao hơn là chỉ gồm có dạng boolean, các thuộc tính thường có dạng biểu diễn số liên tục như tuổi, số vốn, hay được chia khoảng như mức thu nhập (thấp, trung bình, cao…). Các thuộc tính boolean có thể được xem như trường hợp riêng của thuộc tính chia khoảng. Việc giới hạn các luật kết hợp với các thuộc tính boolean rõ ràng là đã giới hạn khả năng phân tích một cơ sở dữ liệu nhằm mang lại những thông tin hữu ích. Một mở rộng tự nhiên là xem xét các luật kết hợp cho các cơ sở dữ liệu mà các thuộc tính là các số định lượng. Bài toán này được giới thiệu đầu tiên trong [40] và được gọi là bài toán luật kết hợp lượng hoá (Quantitative Association Rules Problem). Các luật này có thể được phát biểu dạng như sau: “45% người trong độ tuổi [40-50], đã kết hôn có hai ô tô.” Nhằm tận dụng các thuật toán đã có đối với bài toán luật kết hợp boolean, [40] đưa ra cách giải quyết phân hoạch miền giá trị của các thuộc tính thành các khoảng và sau đó kết hợp các khoảng rời nhau để cho lời giải của bài toán. Thao tác này thực chất là chuyển bài toán luật kết hợp số về bài toán luật kết hợp boolean. Tuy nhiên, như trong [35] đã chỉ ra, rõ ràng việc sử dụng các biên rõ ràng giữa các phân hoạch của miền thuộc tính sẽ làm mất một số thông tin có thể thu được từ cơ sở dữ liệu đối với các giá trị nằm gần các biên này. Trong [35], đề nghị xem xét bài toán tìm các luật kết hợp dạng “Nếu X là A thì Y là B”, trong đó A và B là các tập mờ. Ví dụ, ta có các luật dạng “Một người trung niên thì thường có mức sống trung lưu.”. Trên thực tế, các thuộc tính số có thể quy về các thuộc tính mờ, ví dụ, độ tuổi [40-50] tương ứng với độ tuổi trung niên. Ngược lại, nếu coi các thuộc tính là tập mờ, với giá trị tương ứng trong một bản ghi biểu diễn độ thuộc của đối tượng vào tập mờ đó, khi đó các thuộc tính mờ có thể được coi như trường hợp riêng của thuộc tính lượng hoá. Thuộc tính boolean cũng có thể được coi là một trường hợp riêng của thuộc tính mờ. Việc sử dụng các tập mờ có ưu điểm thể hiện một cách mềm dẻo biến đổi giữa đối tượng thuộc hay không thuộc một tập nào đó so với phương pháp phân hoạch. Hơn nữa, việc sử dụng tập mờ tỏ ra đặc biệt có ưu thế đối với các bài toán có dữ liệu đầu vào là các biến ngôn ngữ. Bài toán tìm các luật kết hợp đối với các cơ sở dữ liệu mờ, nghĩa là cơ sở dữ liệu có các thuộc tính có miền giá trị là đoạn [0,1], trong [35] được gọi là bài toán luật kết hợp mờ. Trong thực tế, việc sử dụng các toán tử mờ có ngưỡng có thể có những ý nghĩa nhất định trong việc phân tích các dữ liệu. Lấy ví dụ, đối với các luật kết hợp mờ dạng “Những người giàu, nhiều tuổi thường thích đi du lịch”, việc sử dụng ngưỡng khi phân tích mức độ giàu cũng như mức độ nhiều tuổi là rất có ý nghĩa đối với những nhà quản lý hoạch định phương án tiếp thị kinh doanh của một công ty du lịch. Mô tả bài toán Tìm kiếm luật kết hợp mờ là tìm kiếm các luật kết hợp sử dụng tập mờ để mô tả dữ liệu đầu. Trong phần này, chúng tôi sẽ đưa ra các khái niệm cơ bản cho bài toán tìm luật kết hợp mờ. Thuộc tính và cơ sở dữ liệu Cho I là tập các thuộc tính I = {I1,…,In}, trong đó dom(Iv) là miền giá trị của thuộc tính Iv. Lấy ví dụ, trong cơ sở dữ liệu quản lý về các tính năng kỹ thuật của xe gắn máy, thông số về lượng xăng tiêu thụ trung bình trên 100km là một thuộc tính, với dom = [0,100]. Ta có một cơ sở dữ liệu D trên I là tập các bản ghi d. Với mọi bản ghi d D, ta có d[Iv] xác định giá trị iv dom(Iv) của thuộc tính Iv của d. Từ Xét I = {I1, I2, …, In} là tập các thuộc tính, giả sử mỗi một thuộc tính Iv có thể được mô tả bằng một tập các từ Lv = { ,,…,}. Lấy ví dụ, thông số về lượng xăng tiêu thụ trung bình trên 100km có thể được mô tả bằng tập từ {“thấp”, “trung bình”, “cao”}. Chú ý rằng, ở đây, các từ mô tả các thuộc tính khác nhau là khác nhau, mặc dù chúng có thể có cùng nhãn, ví dụ cùng là “thấp”, “trung bình” hay “cao”. Xét là một từ mô tả thuộc tính Iv của cơ sở dữ liệu. Khi đó, được biểu diễn bằng một hàm thuộc : dom(Iv) → [0,1] biểu diễn mức độ đúng đắn của việc sử dụng từ để mô tả giá trị iv dom(Iv). Lấy ví dụ hàm thuộc ứng với từ “thấp” trong mô tả thuộc tính lượng xăng tiêu thụ trung bình trên 100km của xe biểu diễn mức độ đúng đắn của việc sử dụng từ “thấp” khi mô tả một lượng xăng x nào đó, nghĩa là mức độ đúng đắn của mệnh đề “lượng xăng tiêu thụ x là thấp”. Ký hiệu Mv là tập tất cả các hàm thuộc biểu diễn các từ mô tả thuộc tính Iv. LI là tập tất cả các tập từ mô tả các thuộc tính của I, LI được gọi là mô tả của I. MI là tập tất cả các tập các hàm thuộc biểu diễn các từ trong mô tả LI của I, MI được gọi là biểu diễn của I ứng với LI. Mệnh đề Cho trước một cơ sở dữ liệu D trên tập thuộc tính I và các tập từ cũng như các hàm thuộc gắn với các thuộc tính này. Từ cơ sở dữ liệu này, bài toán tìm luật kết hợp mờ tìm cách rút ra các luật dạng: “Nếu X là A thì Y là B”. Trong phần này, chúng tôi sẽ xem xét biểu diễn hình thức của các mệnh đề dạng “X là A” hay “Y là B”. Định nghĩa 3.2.1. Cho I là tập thuộc tính, X = {, , …, } I là tập các thuộc tính, cho A là tập các từ mô tả các thuộc tính trong X, nghĩa là A = {, , …,}. A được gọi là mô tả của X, khi đó một mệnh đề trên tập thuộc tính I và tập từ LI (hay gọi tắt mệnh đề) “X là A”, có ký hiệu hình thức . Chú ý rằng ở đây, có tương ứng một một giữa A và X, theo nghĩa từ trong A là mô tả của thuộc tính trong X. Như trong [35] đã chỉ ra, chúng ta chỉ quan tâm tới những luật kết hợp có độ quan trọng và độ chắc chắn đủ lớn, sau đây, chúng ta sẽ tìm hiểu về các tiêu chuẩn đánh giá một luật kết hợp mờ. Định nghĩa 3.2.2[35]. Cho cơ sở dữ liệu D trên tập các thuộc tính I, là một mệnh đề trên I và tập từ LI, MI là biểu diễn của I ứng với LI. Xét d D là một bản ghi. Khi đó, độ ủng hộ của d cho ứng với MI được cho bởi: vote(d,X,A,MI) := (d[]).(d[])…(d[])) (3.2.1) Ý nghĩa của biểu thức trên biểu diễn giá trị đúng đắn của mệnh đề “ là và là và … và là ”. Trong trường hợp không gây nhầm lẫn có thể bỏ qua MI. Trong [35] cũng đề nghị rằng, trong công thức (3.2.1) bên cạnh toán tử nhân, cũng có thể sử dụng toán tử min. Từ đó, ta có thể thấy, trong (3.2.1), chúng ta có thể sử dụng một t-chuẩn trong lôgíc mờ để xác định độ ủng hộ, đặc biệt, ở đây, chúng tôi đề nghị sử dụng t-chuẩn có ngưỡng [9]: vote(d,X,A,MI) := ((d[]),(d[]),…,(d[])) Trong đó, ngưỡng αvk ứng với thuộc tính Iv và từ mô tả thuộc tính này. Việc sử dụng t-chuẩn có ngưỡng ở đây rất có ý nghĩa đối với một số bài toán thực tế. Lấy ví dụ, đối với thuộc tính lượng xăng tiêu thụ trung bình của xe máy, nếu độ thuộc của giá trị này vào từ “rất cao” là lớn, chúng ta nên và cần thiết sử dụng những xem xét khác với các trường hợp khác. Vấn đề sử dụng t-chuẩn có ngưỡng trong việc xác định độ ủng hộ của một bản ghi đối với một mệnh đề sẽ được mô tả rõ hơn ở phần sau. Định nghĩa 3.2.3 [35]. Khi đó độ hỗ trợ của trong D ứng với MI : supp(X,A,D,MI) := Trong trường hợp không gây nhầm lẫn, có thể bỏ qua D và MI. Bên cạnh khái niệm độ hỗ trợ, chúng ta cũng có thể sử dụng khái niệm độ quan trọng. Định nghĩa 3.2.4[35]. Độ quan trọng của trong D ứng với MI : sign(X,A,D,MI) := Trong trường hợp không gây nhầm lẫn, có thể bỏ qua D, MI. Trong bài toán tìm luật kết hợp mờ, chúng ta chỉ quan tâm tới những mệnh đề có độ hỗ trợ (độ quan trọng) là đủ lớn, nghĩa là vượt một ngưỡng cho trước nào đó. Nghĩa là, chúng tôi chỉ quan tâm tới những mệnh đề có supp(X,A,D,MI) ≥ σabs hay sign(X,A,D,MI) ≥ σrel, với σabs và σrel là các ngưỡng cho trước nào đó. Nếu một mệnh đề có độ hỗ trợ đủ lớn ta gọi mệnh đề đó là đáng kể. Định nghĩa 3.2.5. Tập các mệnh đề đáng kể trên D ứng với ngưỡng σ và MI được cho bởi: S(D,σ,MI) := { | supp(X,A) ≥ σ} Bài toán 3.2.1. (Tìm mệnh đề) Cho trước một tập thuộc tính I, LI là tập từ mô tả I, MI là tập hàm thuộc biểu diễn I ứng với LI, một cơ sở dữ liệu D trên I, và ngưỡng hỗ trợ nhỏ nhất σ, tìm S(D,σ,MI). Trong thực tế, chúng ta không chỉ cần các mệnh đề đáng kể mà còn cần xác định cả độ hỗ trợ của chúng để sử dụng khi tìm luật kết hợp. Luật kết hợp Trong phần này, chúng tôi sẽ mô tả luật kết hợp và các tiêu chí để đánh giá một luật kết hợp là quan tâm. Định nghĩa 3.2.6. Cho trước một tập thuộc tính I, LI là tập các từ mô tả I, MI là tập các hàm thuộc biểu diễn I ứng với LI, D là một cơ sở dữ liệu trên I, mục tiêu của chúng tôi là tìm các luật dạng “Nếu X là A thì Y là B” có biểu diễn hình thức → , trong đó X, Y I là tập các thuộc tính, X Y = {}, A, B là các tập từ mô tả X, Y tương ứng. Phần được gọi là phần thân (hay tiền tố) của luật, được gọi là phần đầu (hay hệ quả) của luật. Ý nghĩa của luật này nói lên việc nếu “X là A” được thoả mãn thì “Y là B” cũng được thoả mãn. Định nghĩa 3.2.7[35]. Cho trước một tập thuộc tính I, tập từ LI mô tả I, tập hàm thuộc MI biểu diễn I ứng với LI, D là cơ sở dữ liệu trên I, X, Y I là các tập thuộc tính, X Y = {}, A, B là các tập từ mô tả X, Y tương ứng. Độ hỗ trợ của luật → trên D ứng với MI được cho bởi: supp( → ,D,MI) = supp(X Y,A B,D,MI) Độ chắc chắn (certainty) của luật trên D ứng với MI được cho bởi: cert( → ,D,MI) = Trong trường hợp không gây nhầm lẫn, có thể bỏ qua D, MI. Luật được gọi là tin chắc nếu độ chắc chắn của nó vượt một ngưỡng độ chắc chắn tối thiểu γ cho trước nào đó. Một luật được gọi là quan tâm nếu nó là đáng kể và tin chắc. Định nghĩa 3.2.8. Tập các luật quan tâm được ký hiệu: R(D,σ,γ,MI) = { → | X,Y I, X Y = {}, S(D,σ,MI), cert( → ) ≥ γ} Bài toán 3.2.2. (Tìm luật) Cho trước I là tập thuộc tính, LI là tập các từ mô tả I, MI là tập các hàm thuộc biểu diễn I ứng với LI, D là cơ sở dữ liệu trên I, σ, γ tương ứng là các ngưỡng độ hỗ trợ và độ chắc chắn tối thiểu, tìm R(D,σ,γ,MI). t-chuẩn có ngưỡng và độ ủng hộ Trong phầ._.

Các file đính kèm theo tài liệu này:

  • docDAN085.doc
Tài liệu liên quan