“Stable Diffusion” là một trong những công nghệ đang thu hút sự chú ý trong lĩnh vực AI tạo sinh. Trí tuệ nhân tạo (AI) là trí tuệ nhân tạo có khả năng tự động tạo ra dữ liệu mới từ dữ liệu hiện có.
「Stable Diffusion」tạm dịch là “Sự khuếch tán ổn định” được giải thích ở đây chứng minh hiệu suất cao trong việc tạo hình ảnh và được sử dụng trong nhiều dự án sáng tạo.

Bài viết này cung cấp lời giải thích chi tiết về khái niệm cơ bản của “Sự khuếch tán ổn định”, cơ chế, cách sử dụng cũng như những ưu điểm và thách thức của nó.
Nếu bạn quan tâm đến AI tạo hình ảnh “Stable Diffsion”, hãy nhớ đọc bài viết này để tham khảo.
Generative AI “Stable Diffusion” là gì?
Generative AI là công nghệ AI tạo hình ảnh do công ty khởi nghiệp Stability AI của Anh phát triển, có khả năng tạo ra dữ liệu mới từ dữ liệu hiện có. “Stable Diffusion” có thể được sử dụng cho nhiều ứng dụng khác nhau, bao gồm không chỉ tạo hình ảnh mà còn tạo giọng nói và tạo văn bản.
“Stable Diffusion” là AI tạo ra dựa trên mô hình khuếch tán và được đặc trưng bởi tính ổn định và hiệu suất cao so với các AI tạo ra khác.
Trong số nhiều AI tạo hình có trên thị trường, một tính năng chính của AI tạo hình ảnh “Stable Diffusion” là nó được cung cấp dưới dạng mã nguồn mở, nghĩa là người dùng có thể sử dụng miễn phí.
▼Trang web chính thức: Tạo hình ảnh AI Stable Diffusion:
https://ja.stability.ai/stable-diffusion
StableDiffusion có thể tạo ra những loại mô hình nào?

AI tạo hình ảnh “Stable Diffusion” có các chức năng sau:
・Chuyển văn bản thành hình ảnh
・Tạo ảnh sang ảnh
・Tạo đồ họa, tác phẩm nghệ thuật và logo
- Chỉnh sửa và chỉnh sửa hình ảnh
・Sản xuất video
Chúng tôi sẽ đi vào chi tiết các tính năng của từng chức năng tạo ra và hình ảnh thực tế.
・Chuyển văn bản thành hình ảnh(Text To Image)
AI tự động tạo ra hình ảnh dựa trên văn bản do người dùng nhập vào.
Hình ảnh hoa anh đào này được tạo bằng chức năng Chuyển văn bản thành hình ảnh trong “Stable Diffusion 3.5 Medium”.
Văn bản (lời nhắc) được nhập lần này như sau:
▼ Lời nhắc (Prompt)
「Japanese garden with cherry blossoms in bloom.(Khu vườn Nhật Bản với hoa anh đào nở rộ.)」

(Nguồn:Stable Diffusion)
・Tạo ảnh từ ảnh(Image To Image)
Tương tự, AI có thể tải hình ảnh do người dùng chuẩn bị và cộng thêm hướng dẫn vào văn bản, sau đó sẽ tạo ra hình ảnh mới dựa trên hình ảnh gốc và theo hướng dẫn trong văn bản.
・Tạo đồ họa, tác phẩm nghệ thuật và logo
Bạn có thể tạo tác phẩm nghệ thuật, đồ họa và logo theo nhiều phong cách khác nhau bằng cách sử dụng lời nhắc bạn chọn. Tất nhiên, bạn không thể xác định trước kết quả, nhưng bạn có thể sử dụng bản phác thảo để hướng dẫn bạn tạo logo.
▼Lời nhắc (prompt)
「Simple icon, ShibaInu illustration.(Biểu tượng đơn giản, hình minh họa của ShibaInu.)」

(Nguồn: Stable Diffusion)
・Chỉnh sửa và chỉnh sửa hình ảnh
Bạn có thể chỉnh sửa và chỉnh sửa ảnh bằng công nghệ tạo ảnh AI “Stable Diffusion”. Sử dụng AI Editor để tải hình ảnh và sử dụng cọ tẩy để che các vùng bạn muốn chỉnh sửa.
Sau đó, nó sẽ tạo ra lời nhắc để xác định mục tiêu chỉnh sửa hoặc sửa ảnh của bạn. Ví dụ, bạn có thể khôi phục ảnh cũ, xóa đối tượng khỏi ảnh hoặc thay đổi đặc điểm của chủ thể.
Bằng cách sử dụng phần mở rộng “HakuImg” của AI tạo hình ảnh “Stable Diffusion”, có thể thực hiện xử lý hình ảnh toàn diện.
・Sản xuất video
Stable Diffusion có phần mở rộng gọi là “mov2mov”.
Video gốc được phân tích từng khung hình bằng AI và kết quả diễn giải lại của AI được tạo ra và xuất ra dưới dạng video.
Sử dụng và công cụ Stable Diffusion

(Nguồn: Stable Diffusion)
Để sử dụng AI tạo hình ảnh “Stable Diffusion”, bạn sẽ cần một số công cụ và thông số kỹ thuật cũng như tài nguyên máy tính đủ tốt.
Cách sử dụng AI tạo hình ảnh “Stable Diffusion”
Có hai cách để sử dụng AI tạo hình ảnh “Stable Diffusion”: bạn có thể chạy AI tạo hình ảnh trong môi trường được xây dựng trên trình duyệt web hoặc bạn có thể tạo môi trường của riêng mình và chạy cục bộ.
① Tạo trong môi trường ứng dụng web
② Cài đặt Stable Diffusion vào môi trường do người dùng tạo ra.
Hoặc tạo ra nó bằng cách viết mã lập trình
① Một nền tảng có thể sử dụng trên trình duyệt web và bằng cách đăng ký tài khoản, bạn có thể dễ dàng sử dụng AI tạo hình ảnh “Stable Diffusion”.
Công nghệ tạo hình ảnh AI “Stable Diffusion” có thể được sử dụng trên các nền tảng sau.
・mage.space
・Hugging Face
・Dream Studio
② Phương pháp cài đặt StableDiffusion trên máy tính của bạn và sử dụng trong môi trường cục bộ.
Bạn có thể thực hiện các thiết lập chi tiết bằng công cụ có tên “Stable Diffusion web UI”.
Nếu bạn đang sử dụng AI tạo hình ảnh “Stable Diffusion” lần đầu tiên, chúng tôi khuyên bạn nên bắt đầu với phiên bản trình duyệt web ①.
Các công cụ và tài nguyên để sử dụng Stable Diffusion
Để sử dụng AI tạo hình ảnh “Stable Diffusion”, bạn cần có phần cứng và phần mềm phù hợp. Ví dụ, bạn sẽ cần một máy tính được trang bị GPU hiệu suất cao và môi trường phần mềm để cài đặt thư viện AI tạo hình ảnh “Stable Diffusion”.
Bảng dưới đây tóm tắt các thông số kỹ thuật PC được khuyến nghị để sử dụng AI tạo hình ảnh “Stable Diffusion”.
Thông số kỹ thuật đề xuất | |
PC | Desktop PC |
OS | Windows(64bit) |
CPU | Các mẫu mới nhất của Core i5-i7 và Ryzen 5-7 |
GPU | Dòng RTX 30, dòng RTX 40 VRAM 12GB trở lên |
Memory | 16GB đến 32GB |
Storage | 512GB trở lên (nếu có thể thì 1TB) |
(Nguồn:Dospara plus)
Q. Windows có phải là hệ điều hành tốt hơn không?
Nếu bạn sử dụng Stable Diffusion, chúng tôi khuyên bạn nên sử dụng hệ điều hành Windows thay vì macOS.
Theo Stable Diffusion, Windows là hệ điều hành được khuyến nghị.

(Nguo62n:Stable Diffusion webUIドキュメント)
Hiện tại, hầu hết các tính năng của Web UI đều hoạt động chính xác trên macOS, ngoại trừ tính năng đào tạo và thẩm vấn CLIP. Việc đào tạo có vẻ hiệu quả nhưng lại cực kỳ chậm và tiêu tốn quá nhiều trí nhớ.
CLIP Interrogator có sẵn, nhưng nó không hoạt động bình thường với khả năng tăng tốc GPU mà macOS sử dụng, do đó trong cấu hình mặc định, nó chạy hoàn toàn thông qua CPU (chậm hơn)
Công nghệ tạo hình ảnh AI “Stable Diffusion” sẽ gặp lỗi do thiếu bộ nhớ nếu dung lượng VRAM là 4GB hoặc ít hơn. Có thể xảy ra trường hợp lỗi khiến hình ảnh minh họa AI không được tạo ra, do đó bạn cần có một chiếc PC có cấu hình tốt.
Ưu điểm và thách thức Stable Diffusion
Công nghệ tạo hình ảnh AI “Stable Diffusion” có ưu điểm chính là dễ sử dụng do khả năng quét đơn giản, nhưng nó cũng có những vấn đề như độ chính xác của dữ liệu được quét bị hạn chế.
Trong chương này, chúng ta sẽ xem xét những ưu điểm và thách thức của AI tạo hình ảnh “Stable Diffusion” và giải thích chi tiết từng ưu điểm và thách thức. Hiểu rõ những lợi thế và thách thức, đồng thời cân nhắc cách sử dụng AI tạo hình ảnh theo cách phù hợp với bạn.
Ưu điểm
Ưu điểm của công nghệ tạo hình ảnh AI “Stable Diffusion” như sau:
- 1: Miễn phí sử dụng
- 2: Tính linh hoạt cao
- 3: Không có hạn chế về thiết bị
Chúng tôi sẽ giải thích những ưu điểm của công nghệ tạo hình ảnh AI “Stable Diffusion”.
Ưu điểm 1: Miễn phí sử dụng
Công nghệ AI tạo hình ảnh “Stable Diffusion” là một AI nguồn mở, được cung cấp cho công chúng nên người dùng có thể sử dụng miễn phí.
Ưu điểm 2: Tính linh hoạt cao
Nó có thể tạo ra nhiều hình ảnh khác nhau, từ hình ảnh chân thực đến hình ảnh theo phong cách anime.
Nó cũng có các tùy chọn để điều chỉnh hình ảnh cơ sở, số lượng hình ảnh cần tạo, độ phân giải hình ảnh đầu ra, v.v., khiến nó trở nên cực kỳ linh hoạt.
Ưu điểm 3: Không có hạn chế về thiết bị
Một lợi thế lớn của công nghệ tạo hình ảnh AI “Stable Diffusion” là không có hạn chế về thời gian xuất hoặc thời gian sử dụng.
Khi thanh toán cho gói đăng ký, có thể có những hạn chế về thiết bị có thể sử dụng, nhưng công nghệ tạo hình ảnh AI “Stable Diffusion” không có hạn chế về thiết bị.
Một tính năng đáng chú ý là không có giới hạn về hình ảnh đầu ra hoặc thời gian sử dụng.
Thách thức của Stable Diffusion
Mặt khác, công nghệ tạo hình ảnh AI “Stable Diffusion” cũng có một số vấn đề. Có ba vấn đề cần lưu ý:
- Vấn đề 1: Dung lượng dữ liệu bị hạn chế
- Vấn đề 2: Có điều kiện về phần cứng có sẵn
- Vấn đề 3: Phiên bản trình duyệt web có hạn chế về khả năng tùy chỉnh
Chúng tôi sẽ giải thích từng thách thức mà AI tạo hình ảnh “Khuếch tán ổn định” phải đối mặt.
Vấn đề 1: Dung lượng dữ liệu bị hạn chế
Với công nghệ tạo hình ảnh AI “Stable Diffusion”, lỗi sẽ xảy ra do bộ nhớ không đủ nếu dung lượng VRAM là 4GB hoặc ít hơn.
Nếu xảy ra lỗi, nhiều vấn đề khác nhau có thể xảy ra, chẳng hạn như không thể tạo hình minh họa AI, không thể đào tạo AI hoặc không thể tạo hình minh họa có độ phân giải cao.
Nếu cấu hình máy tính của bạn thấp, bạn nên cẩn thận với lỗi trên.
Vấn đề 2: Có điều kiện về phần cứng có sẵn
Công nghệ tạo hình ảnh AI “Stable Diffusion” yêu cầu thông số kỹ thuật PC cao.
Tuy nhiên, để chạy AI tạo hình ảnh một cách ổn định, cần có PC có thông số kỹ thuật cao, điều này có thể gây khó khăn cho người dùng cá nhân.
Vấn đề 3: Phiên bản trình duyệt web có hạn chế về khả năng tùy chỉnh
Công nghệ tạo hình ảnh AI “Stable Diffusion” có phiên bản trực tuyến có thể sử dụng trên trình duyệt web và không phụ thuộc vào thông số kỹ thuật phần cứng.
Tuy nhiên, số lượng hình ảnh có thể tạo miễn phí bị giới hạn và khả năng tùy chỉnh cũng bị hạn chế.
Tóm tắt

(Nguo62n:Stable Diffusion)
Công nghệ tạo hình ảnh AI “Stable Diffusion” có khả năng tùy chỉnh cao và miễn phí, do đó được khuyến khích cho người mới bắt đầu sử dụng AI tạo hình lần đầu.
Ngoài ra còn có nhiều AI tạo hình ảnh khác, vì vậy, bạn nên làm rõ mục đích sử dụng AI tạo hình ảnh và chọn AI phù hợp với mình.
Nếu bạn có bất kỳ thắc mắc nào về AI tạo hình ảnh, vui lòng liên hệ với ONETECH. ONETECH có kinh nghiệm tạo hệ thống ứng dụng AI và cũng có thể tư vấn về AI tạo hình ảnh.
InsightscanX cải thiện đáng kể việc quản lý xây dựng
Đây là công cụ cho phép bạn dễ dàng chụp ảnh địa điểm bằng iPhone và quản lý nhiều vấn đề khác nhau ở chế độ 3D.
Chúng tôi sẽ tự động hóa một phần các hoạt động hiện tại bằng cách tận dụng tối đa công nghệ tạo hình ảnh AI “Stable Diffusion”.
Dự kiến phát hành vào mùa xuân năm 2025.
「InSightScanX」 làm thay đổi đáng kể quy trình quản lý trong ngành xây dựng.