Categories AI

Cách tạo ảnh bằng AI thông qua thuật toán của Stable Diffusion

Stable Diffusion

Chắc chắn tạo ảnh bằng AI sẽ ngày càng phát triển trong thời gian tới đây, có 2 nguyên nhân chủ yếu:

  • Tiết kiệm chi phí: ảnh tạo bằng AI rẻ hơn khá nhiều so với việc mua ảnh trên các kho ảnh có phí.
  • Tăng cường sáng tạo: đây là nguyên nhân chủ yếu, AI với kho dữ liệu mẫu cực lớn, và đa dạng phong cách có khả năng sáng tạo gần như vô tận, bạn có khả năng tạo ra các ảnh “unique / độc nhất”, chẳng đụng hàng với bất kỳ ai, mà chỉ cần sử dụng văn bản mô tả thay vì phải có tài năng hội họa.

Tôi sử dụng ứng dụng online nightcafe.studio trong hướng dẫn này, nightcafe.studio (NCS) có ưu điểm là hàng ngày cấp miễn phí 5 credit, nên bạn sẽ không tốn tiền để mua nếu chỉ có nhu cầu tạo 10 – 20 ảnh mỗi ngày, xét ra thì số lượng đó cũng đủ cho đa số người dùng thông thường. Ngoài ra NCS có các tính năng tùy biến chuyên sâu hơn đa số các ứng dụng tương tự.

PS: nhà phát triển chọn tên miền nightcafe.studio dường như lấy cảm hứng từ bức tranh The Night Café của Van Gogh.


Khái niệm căn bản

  • Text Prompt: đây là văn bản mà chúng ta nhập vào để hướng dẫn AI tạo ảnh, điều cần lưu ý ở đây là “đúng từ khóa”. Có vẻ giống như các giai đoạn đầu phát triển của máy tìm kiếm, các từ khóa khớp chính xác với mục đích của bạn là điều chủ chốt để tạo được bức hình phù hợp. Lưu ý, các prompt cần dùng tiếng Anh.
  • Weight: trọng số, nightcafe.studio cho phép chúng ta sử dụng nhiều prompt, và chúng ta có khả năng thay đổi trọng số của từng prompt, nó có thể hiểu như này, trọng số càng cao, thì bạn càng ưu tiên cho prompt đó nhiều hơn, trọng số âm thì có nghĩa là loại trừ.
  • Negative prompt: dùng để hạn chế việc AI tạo ra các ảnh không đúng với mục đích của bạn, ví dụ đây là “negative prompt” mặc định của nightcafe.studio:

“ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, blurry, bad anatomy, blurred, watermark, grainy, signature, cut off, draft” – đại khái nó giúp loại trừ các bức hình xấu, các bức vẽ tay sơ sài, các hình vẽ cơ thể biến dạng, các bức hình có watermark, chữ ký,…Vì để loại trừ nên negative prompt có trọng số âm, bạn có thể điều chỉnh trọng số này (Let me tweak it) trên nightcafe.studio, giá trị mặc định của nó là -0.3. Để bật negative prompt bạn gạt button sang phải.


Các thông số kỹ thuật

  • Mặc định ảnh được tạo ra với hình dạng vuông (1:1), với kích cỡ 512px. Bạn có thể điều chỉnh thông số này ở phần Aspect Ratio để tạo ra các kích cỡ khác, ví dụ Widescreen (16:9) hoặc Landscape (4:3),…
  • Với 1 credit bạn tạo được 4 hình ở kích cỡ tiêu chuẩn (512px), nếu xuất hình ở kích cỡ lớn hơn sẽ cần nhiều credit hơn, có thể hiểu lý do đơn giản là vì cần nhiều tài nguyên máy chủ hơn để tạo hình lớn hơn.
  • Ảnh trả về là định dạng JPG, với chất lượng khá (có vẻ nightcafe.studio đã nén ảnh giảm chất lượng). Khi tôi test thử trên một ứng dụng khác là DeepAI, thì nó cho chất lượng hình tốt hơn.
  • Phiên bản mặc định là Stable Diffusion v1.5, nếu bạn thích thì có thể sử dụng các phiên bản cũ hoặc mới hơn, nhưng có vẻ Stable Diffusion v1.5 hoạt động ổn nhất nên nightcafe.studio đã chọn làm bản mặc định.
  • Nếu muốn tạo nhiều ảnh, bạn điều chỉnh số lượng, tối đa là 16 ảnh trong một lần tạo.

Ví dụ về một vài prompt

  • “Silver cat with blue eyes hyperdetailed by Greg Rutkowski complementary colors acrylic art cel-shaded 4K 3D shading astral anime comic art”

Kết quả:

Ảnh mèo tạo bằng AI
  • “Painting bunch of flowers, volume lighting, in the style of Claude Monet, Jim Burns, Greg Rutkowski, Kandinsky, Amanda Sage, Van Gogh”

Kết quả:

Ảnh hoa tạo bằng AI
Ảnh hoa tạo bằng AI
Ảnh hoa tạo bằng AI
  • “Painting portrait of a man in deep thought, volume lighting, in the style of Claude Monet, Jim Burns, Van Gogh”

Kết quả:

Ảnh nam giới trầm tư tạo bằng AI
Ảnh nam giới trầm tư tạo bằng AI

Ở trên chỉ là vài prompt rất đơn giản trong số hàng tỷ (chính xác phải nó là vô số) prompt mà bạn có thể nhập vào để tạo ra bức hình mong muốn.


Các từ khóa

NCS (nightcafe.studio) cung cấp các từ khóa phổ biến nhất mà người dùng hay nhập ở phần ADD MODIFIERS. Đây là phần mà bạn nên chú ý, vì từ khóa là vấn đề trọng tâm trong việc tạo ảnh bằng AI (ít nhất là với Stable Diffusion, một số AI tạo ảnh khác [Midjourney v3] nghe nói là thông minh hơn, ý là bạn đỡ khổ sở hơn với từ khóa). Một số điểm quan trọng:

  • Tác giả: lựa chọn các tác giả (Artists) cho bức hình sẽ ảnh hưởng lớn nhất đến kết quả đầu ra, nó sẽ quyết định luôn phong cách của bức hình đó. Một số tác giả được ưa thích là Greg Rutkowski, Van Gogh, Leonid Afremov,…Có rất nhiều tác giả và phần này bạn nên tự thử để tìm ra phong cách mà bạn (hoặc độc giả của bạn) ưa thích. Bạn hoàn toàn có thể pha trộn nhiều tác giả với nhau. Vài ba prompt trong ví dụ trên đều áp dụng nhiều tác giả khác nhau, chẳng hạn như “in the style of Claude Monet, Jim Burns, Van Gogh” tức là “hãy nhái theo phong cách của 3 họa sĩ sau Claude Monet, Jim Burns, Van Gogh”.
  • Ánh sáng: ánh sáng ảnh hưởng rất lớn đến cảm nhận về bức tranh, một số từ khóa hay được sử dụng là volumetric lighting, dynamic lighting, dramatic lighting. Ý nghĩa của chúng thì bạn tìm kiếm trên mạng sẽ ra ngay, sẽ tốt hơn là để người không chuyên như tôi giải thích.
  • Độ phân giải hoặc mức độ chi tiết: các từ khóa hay được dùng 8k resolution, 4k resolution, intricately detailed, detailed matte painting,…
  • Các phong trào, hay phong cách nghệ thuật: nếu trong prompt của các bạn có tên nghệ sĩ rồi thì nó sẽ quyết định luôn phong cách nghệ thuật của bức hình. Nếu không thì bạn có thể chỉ cụ thể phong cách mong muốn ở phần Art movements and styles (lấy từ khóa). Nói chung cũng test để tìm ra phong cách bạn ưa thích, và nếu kỹ hơn thì tìm hiểu thêm về các phong cách cụ thể đó.
  • Start Image: đây không phải từ khóa, mà một tính năng thú vị của NCS, ở đó bạn dùng một hình ảnh mẫu đi kèm với văn bản để tạo ra bức hình khác, nói là ảnh mẫu nhưng tùy vào prompt của bạn mà ảnh xuất ra sẽ khác nhiều hay ít so với ảnh mẫu.

Nó còn nhiều phần nữa nếu bạn muốn đi sâu, chẳng hạn như lựa chọn màu sắc (Colors), hoặc Culture / genre.


Học hỏi từ người khác

Nghĩ ra một prompt đơn giản thì tương đối dễ, nó sẽ tạo ra bức hình trông cũng ổn thôi. Nhưng nếu bạn muốn tăng cường sáng tạo, mà không phải thử sai quá nhiều thì nên xem các mẫu prompt từ người khác để lấy ý tưởng. NCS cung cấp phần này ở mục Khám phá (https://creator.nightcafe.studio/explore), nơi show các bức hình mà người sử dụng để công khai. Bạn sẽ rất ngạc nhiên khi thấy một số prompt vô cùng phức tạp tạo ra các bức hình hết sức ấn tượng như thế nào.

Một lưu ý là nhiều khi mọi người “giấu hàng”, tức là họ chỉ show bức hình, tranh ra thôi chứ không show prompt để chúng ta có thể sao chép. Thôi cũng chả trách được, vì để nghĩ ra prompt hay cũng không dễ, ai có lòng thì chia sẻ, tùy tâm.

Một nguồn khác có nhiều prompt hay bạn có thể tham khảo: https://prompthero.com/stable-diffusion-prompts (trang này ngoài gợi ý prompt, cũng cho phép bạn tạo ảnh bằng AI).


Một số ứng dụng trực tuyến khác

NCS được ca ngợi là ứng dụng online rất tốt để tạo ảnh bằng AI, tuy nhiên nó giới hạn miễn phí chỉ 5 credit mỗi ngày, nếu bạn tập hăng thì chắc 15 phút là hết. Tôi sẽ chia sẻ một số trang web khác cho phép bạn tập luyện nhiều hơn:

  • Picsart: tại địa chỉ https://picsart.com/create/editor?category=photos cho phép tạo các bức ảnh cũng bằng thuật toán của Stable Diffusion, bạn tìm đến phần “AI Image Generator” (góc trên bên trái) rồi click vào để nhập prompt. Nhược điểm là mình chỉ dùng cái này để tập luyện thôi, chứ tải ảnh về thì nó có watermark. Công cụ này khá tương đồng với NCS (dù không giống 100%, và cũng ít tùy biến hơn nhiều NCS).
  • Lexica: tại địa chỉ https://lexica.art/aperture, ảnh tải được về, tạo thoải mái, nhưng ảnh ở đây nó không theo phong cách tranh của tác giả như chuẩn, mà thiên về phong cách đồ họa máy tính hơn, đâm tính thẩm mỹ bị hao hụt nhiều, ví dụ:

OK, bài viết đến đây kết thúc là được rồi. Tôi sẽ cập nhật nó khi phát hiện ra điều gì mới. Chúc các bạn một năm mới nhiều niềm vui, sức khỏe tốt, và công việc thuận lợi.

Back to Top