GPT Image 2 được tính phí như thế nào?

Tính bằng tín dụng — mỗi ảnh được tạo sẽ tiêu thụ tín dụng. Tài khoản mới có tín dụng miễn phí để bắt đầu, các gói mới nhất nằm trên trang giá

GPT Image 2 là gì? Có phải đây là model đứng sau image generator mới trong ChatGPT không?

GPT Image 2, hay gpt-image-2, là mô hình hình ảnh native thế hệ mới của OpenAI, ra mắt vào tháng 4 năm 2026. Đây là động cơ phía sau trải nghiệm tạo ảnh mới hơn của ChatGPT, được thiết kế để bám sát chỉ dẫn chính xác hơn, dựng chữ trong ảnh, bố cục đa ngôn ngữ và các tác vụ hình ảnh phức tạp.

Image 2 GPT, GPT Image2, ChatGPT Image2 hay OpenAI Image2 có phải cùng một thứ không?

Đúng. Image 2 GPT, GPT Image2, ChatGPT Image2 và OpenAI Image2 đều trỏ đến cùng một họ mô hình ảnh mới của OpenAI, tức khả năng tạo ảnh mới nhất trong ChatGPT. Tên chính thức là GPT Image 2 và gpt-image-2; các cách viết khác là những tên gọi phổ biến bạn có thể thấy trên mạng

Tôi có thể dùng GPT Image 2 online ở đâu?

Bạn có thể dùng GPT Image 2 ngay trên trang này. Bắt đầu bằng lời nhắc, thêm ảnh tham chiếu nếu cần, chọn tỉ lệ, độ phân giải, chất lượng và số lượng đầu ra, rồi tạo poster, UI mockup, ảnh sản phẩm, khung truyện tranh hoặc bố cục chữ đa ngôn ngữ mà không cần đổi công cụ

Vì sao mọi người tìm Image 2 GPT và ChatGPT Image2?

Tên model mới thường lan truyền trước khi cách viết chính thức ổn định. Image 2 GPT, GPT Image2, ChatGPT Image2, OpenAI Image2 và GPT image generator đều chỉ đến cùng một model ảnh OpenAI mới nhất đang vận hành khả năng tạo ảnh của ChatGPT — tên chính thức là GPT Image 2 (gpt-image-2)

GPT Image 2 khác GPT Image 1 ở điểm nào?

So với GPT Image 1, GPT Image 2 mạnh hơn rõ rệt ở việc bám lời nhắc nhiều ràng buộc, kết xuất chữ 48+ ngôn ngữ, xử lý chất liệu chân thực và dàn bố cục dài như poster hay bao bì

Model hỗ trợ những độ phân giải, tỷ lệ và định dạng đầu ra nào? Có 4K hay nền trong suốt không?

Hỗ trợ tối đa 4K (cạnh dài nhất 3840px), nhiều tỷ lệ dựng sẵn và mặc định xuất WebP. Nền trong suốt không khả dụng cho mọi yêu cầu

Nên chọn GPT Image 2, DALL-E 3, Midjourney hay Nano Banana 2?

Hãy chọn GPT Image 2 nếu bạn cần typography chính xác, poster / bao bì / storyboard truyện tranh đa ngôn ngữ. Hãy cân nhắc Midjourney nếu bạn cần thử nghiệm phong cách nghệ thuật tự do hơn hoặc ảnh chân thực theo hướng khám phá. Hãy chọn Nano Banana 2 nếu bạn cần ghép từ nhiều ảnh tham chiếu, tìm hình trên web và thử sai nhanh. DALL-E 3 là model tạo ảnh thế hệ trước của OpenAI cho ChatGPT và nay đã được dòng GPT Image thay thế

Text rendering của model này so với Midjourney, Ideogram và FLUX thế nào?

GPT Image 2 ổn định hơn với tiêu đề dài, đoạn văn dày, logo và bố cục nhiều hệ chữ. Khoảng cách chữ, chính tả và kỷ luật bố cục giúp nó phù hợp hơn cho quy trình thiết kế phụ thuộc nhiều vào typography

Model có xử lý được graphic design, UI design, comic storyboard và portrait photoreal không?

Có. GPT Image 2 dùng tốt cho print ad, packaging, UI mockup, comic storyboard, portrait photoreal và product rendering

Khả năng bám lời nhắc tốt đến đâu? Có hỗ trợ sắp chữ nhiều ngôn ngữ không?

Rất tốt. Khả năng giữ được mô tả chi tiết, số lượng vật thể, style direction và block text đa ngôn ngữ trong cùng một ảnh là một trong những điểm mạnh nổi bật nhất của model này

Ảnh tham chiếu hoạt động thế nào? Có ghép từ nhiều ảnh tham chiếu cùng lúc được không?

Mỗi lần chạy hỗ trợ nhiều ảnh tham chiếu. Hãy tải ảnh rõ, tập trung vào chủ thể, mô tả chính xác mỗi ảnh cần giữ lại hoặc ảnh hưởng đến phần nào, rồi nêu trong lời nhắc điều bạn muốn thay đổi

Mô hình này nhanh đến mức nào và tính phí ra sao?

Phần lớn lời nhắc hoàn tất trong 10–60 giây; lời nhắc phức tạp có thể mất đến 2 phút. Có tín dụng miễn phí khi đăng ký, tính tín dụng theo từng ảnh được tạo, gói linh hoạt

Tôi có thể dùng kết quả cho mục đích thương mại không? Có watermark nhìn thấy được không?

Kết quả không có watermark nhìn thấy được. Việc dùng cho mục đích thương mại phụ thuộc vào quyền của bạn đối với lời nhắc, tư liệu tham chiếu, chủ thể, thương hiệu và các chính sách hoặc luật áp dụng. OpenAI có thể nhúng tín hiệu nguồn gốc vô hình không ảnh hưởng đến kết quả hiển thị

GPT Image 2

Mô hình ảnh native của OpenAI — kiểm soát prompt mạnh, typography đa ngôn ngữ, chỉnh sửa nhiều tham chiếu

4K HDBám lời nhắcMọi styleChữ + ảnhChữ rõ

Bắt đầu tạo

Xem thêm những gì nó làm được

Hình ảnh thương hiệu, chỉnh sửa nhiều tham chiếu, infographic — cùng một mạch: chữ + bố cục + chỉ dẫn phức tạp trong một ảnh

“Áp phích thương hiệu hanok-stay cao cấp với bố cục chia cột linh hoạt, khoảng trống màu kem rộng, phân cấp chữ song ngữ và cảm giác du lịch chân thực, yên tĩnh”

Áp phích di sản song ngữ

Hình ảnh chủ đạo thương hiệu dạng chia bố cục: ảnh chân dung đầy đủ ở bên trái, mảng nền kem rộng ở bên phải chứa tiêu đề tiếng Trung, dòng phụ tiếng Trung và cụm nhận diện thương hiệu bằng tiếng Anh. GPT Image 2 xử lý bố cục, khoảng cách và thứ bậc chữ Trung - Anh trong một bản dựng sẵn dùng.

“Tạo áp phích chủ đạo thương mại điện tử cao cấp cho ngành làm đẹp: người mẫu nữ Hàn Quốc nhìn nghiêng, làn da sáng sạch, cầm chai serum thủy tinh mờ, chữ có chân thanh lịch, ánh sáng studio mềm và cảm giác thương hiệu chăm sóc da sang trọng”

Sáng tạo thương mại điện tử cao cấp

Người mẫu, tĩnh vật sản phẩm và chữ thương hiệu được tạo trong cùng một khung hình. GPT Image 2 dựng hình ảnh chủ đạo thương mại điện tử với làn da sáng, phản chiếu trên chai và chất lượng bố cục đủ dùng cho chiến dịch.

“Đồ họa thông tin thực vật màu nước khổ dọc về hành trình từ hạt đến quả, với nhãn tiếng Trung và dòng thời gian sinh trưởng 1-19”

Đồ họa thông tin thực vật màu nước

Tám giai đoạn sống từ hạt đến quả, minh họa màu nước kiểu tự nhiên học cổ điển, toàn bộ nhãn bằng tiếng Trung và dòng thời gian sinh trưởng 1-19. GPT Image 2 có thể dàn đồng thời lượng thông tin khoa học dày đặc và minh họa thành một bản giải thích thực vật sẵn sàng đăng.

“Tạo trang chiếu mẫu thuyết trình theo phong cách Apple keynote”

Slide Keynote kiểu Apple

Trang chiếu mẫu với tiêu đề lớn, danh sách nguyên tắc đánh số và thiết bị chủ đạo nổi bên phải, đủ chỉn chu để dùng làm slide sân khấu.

“Tạo một trang manga vẽ tay toàn trang với sáu khung truyện, kể câu chuyện một nhà thám hiểm trẻ phát hiện cây bút lông phát sáng trong tàn tích cổ”

Bố cục trang truyện manga

Một trang manga Nhật Bản sáu khung: cảnh mở đầu ở tàn tích cổ, thư viện xa, cận cảnh nhân vật chính, khoảnh khắc phát hiện cây bút lông phát sáng, nhịp thức tỉnh sức mạnh và cận cảnh con mắt ở cuối. GPT Image 2 dàn cả trang trong một lần: nhịp khung, hiệu ứng âm thanh, bóng thoại, ô kể chuyện dọc tiếng Nhật, biểu cảm và phối cảnh.

“Biến ảnh căn hộ trống có chú thích thành bản dựng phòng khách - ăn hiện đại ấm áp, giữ nguyên cấu trúc phòng và khung nhìn cửa sổ”

Bản dựng nội thất mềm

Tải lên ảnh phòng trống có ghi chú bố cục màu đỏ. GPT Image 2 biến ảnh đó thành ý tưởng phòng khách - phòng ăn hiện đại ấm áp với kệ TV, tủ thấp, sofa, bàn trà, thảm, tủ phụ, bàn ăn, cây xanh, tranh treo và ánh sáng nhiều lớp, đồng thời giữ lại phối cảnh gốc.

“Một chủ đạo trang chủ SaaS chỉn chu với điều hướng, tiêu đề, CTA, phong cảnh minh hoạ và bốn thẻ tính năng”

Thiết kế UI chuyên nghiệp

Ví dụ thiết kế giao diện có thể dùng ngay cho trang chủ sản phẩm hoặc trang marketing, đầy đủ điều hướng, khu vực mở đầu, CTA và thẻ tính năng.

“Ý tưởng chuyển ảnh thành phong cách: bên trái là ảnh tham chiếu và quá trình phác thảo, bên phải là minh họa vườn Đông Á hoàn thiện như hình ảnh chủ đạo đã hoàn thiện”

Ý tưởng khu vườn từ ảnh sang phong cách

Ảnh, bản phác thảo và minh họa hoàn thiện được hòa vào một hướng phong cách có thể dùng ngay. Tư thế, trang phục và cảnh vườn thống nhất thành vẻ biên tập Đông Á mềm mại — hợp cho bìa hoặc tiểu thuyết hình ảnh

“Bảng ngang từ phác thảo đến thành phẩm, gồm phác thảo ý tưởng, bản vẽ cấu trúc đã làm sạch và hình ảnh thương mại hoàn thiện cho gian hàng hoặc sản phẩm”

Bảng thiết kế từ phác thảo đến thành phẩm

Bên trái là phác thảo ý tưởng, bên phải là hình ảnh chủ đạo hoàn thiện — toàn bộ quá trình phát triển thiết kế nằm trên một bảng trình bày. Phù hợp cho đề xuất, thiết kế triển lãm và duyệt hình ảnh

“Tạo một ảnh chụp thực cảnh tỷ lệ về ngôi đền Nhật Bản lúc hoàng hôn mùa hoa anh đào, bố cục đối xứng chính diện trước chính điện”

Ảnh chụp thực cảnh đền thần giữa mùa hoa anh đào

Chính điện của một ngôi đền Nhật vào lúc hoàng hôn mùa hoa anh đào, bố cục đối xứng chính diện, tiền cảnh và hậu cảnh phủ đầy bokeh sakura, cùng kiến trúc gỗ trang trí vàng và đèn lồng giấy. GPT Image 2 tạo ra ảnh chụp thực cảnh có chiều sâu, vân gỗ, lá vàng và cánh hoa rõ nét, đủ chất lượng để dùng trực tiếp làm ảnh quảng bá

“Tạo áp phích hình ảnh chủ đạo cho hợp tác ba bên của IP anime gốc, tiêu đề "AZURE TALE × SILK VEIL × RiBOSE COLLABORATION"”

Áp phích merchandise anime

Nhân vật chính kiểu magical girl tông xanh nước, nhãn thời trang mỏng nhẹ và dòng búp bê sưu tầm được kết hợp trong một hình ảnh hợp tác ba bên. GPT Image 2 sắp xếp logo nhiều thương hiệu, tiêu đề tiếng Trung, nội dung Trung - Anh - Nhật, ánh sáng nhân vật và tĩnh vật sản phẩm trong một lần tạo.

“Tạo cảnh vườn Hy Lạp cổ điển kiểu pixel-art 16-bit”

Khu vườn Hy Lạp pixel-art

Khung cảnh vườn cổ điển Hy Lạp với tượng đá cẩm thạch, hàng cây bách và biển Địa Trung Hải, đồng thời vẫn giữ cảm giác pixel retro rõ ràng.

“Tạo một hình ảnh chủ đạo chiến đấu phong cách anime Nhật. Nhân vật chính là nữ kiếm sĩ trẻ tóc đen dài, mắt xanh, vẻ mặt điềm tĩnh; mặc giáp ngực bạc cùng giáp tay và giáp chân bạc chạm vàng, váy xanh đậm xẻ cao, dây trắng quấn quanh đùi và vạt váy, thắt lưng vàng ở eo”

Hình ảnh chủ đạo nữ kiếm sĩ anime

Một visual hành động giàu năng lượng với nhát chém đại kiếm, pháo đài đổ nát, mảnh vỡ bay và ánh sáng kiểu anime chất lượng cao.

“Tạo một bảng sprite pixel-art retro 8-bit cho game run-and-gun màn hình ngang nguyên bản, được tổ chức thành bảng tài nguyên 12 khu có nhãn trên nền tối trung tính”

Bảng tài nguyên retro cho trò chơi

Bảng đồ họa 12 vùng gom đủ bối cảnh, nhân vật, vũ khí, vật phẩm và hiệu ứng hình ảnh, được sắp xếp có trật tự để dễ dùng lại.

Trường hợp sử dụng	GPT Image 2	Nano Banana 2
Chữ nằm trong ảnh	Đáng tin hơn cho báo, poster, UI, công thức và bố cục nhiều chữ	Thường đẹp mắt hơn nhưng dễ hụt khi text quá dài
Grid / bảng chữ cái	Bám 100-cell grid và chart A-Z có cấu trúc tốt hơn	Đôi khi bỏ ô hoặc gộp entry
Infographic / visual nghiên cứu	Kỷ luật hơn về cấu trúc và cách trình bày thông tin	Hình có thể đẹp nhưng độ tin cậy thông tin kém ổn định hơn
Độ nhất quán nhân vật	Chỉnh sửa dẫn hướng bằng nhiều ảnh tham chiếu	Linh hoạt hơn nếu cần nhiều reference cùng lúc
Portrait / chất liệu	Khi yêu cầu photorealism rõ ràng, chất lượng material tăng lên rõ	Mặc định thường cho cảm giác giống ảnh thật hơn
Clone style	Đôi khi dễ drift khỏi style gốc	Giữ brushwork nguồn tốt hơn khi thay subject
Kích thước và tỷ lệ	Tỷ lệ preset cùng auto sizing	14 preset, gồm cả tỷ lệ siêu rộng

Trường hợp sử dụng

GPT Image 2

Nano Banana 2

Chữ nằm trong ảnh

Đáng tin hơn cho báo, poster, UI, công thức và bố cục nhiều chữ

Thường đẹp mắt hơn nhưng dễ hụt khi text quá dài

Grid / bảng chữ cái

Bám 100-cell grid và chart A-Z có cấu trúc tốt hơn

Đôi khi bỏ ô hoặc gộp entry

Infographic / visual nghiên cứu

Kỷ luật hơn về cấu trúc và cách trình bày thông tin

Hình có thể đẹp nhưng độ tin cậy thông tin kém ổn định hơn

Độ nhất quán nhân vật

Chỉnh sửa dẫn hướng bằng nhiều ảnh tham chiếu

Linh hoạt hơn nếu cần nhiều reference cùng lúc

Portrait / chất liệu

Khi yêu cầu photorealism rõ ràng, chất lượng material tăng lên rõ

Mặc định thường cho cảm giác giống ảnh thật hơn

Clone style

Đôi khi dễ drift khỏi style gốc

Giữ brushwork nguồn tốt hơn khi thay subject

Kích thước và tỷ lệ

Tỷ lệ preset cùng auto sizing

14 preset, gồm cả tỷ lệ siêu rộng

GPT Image 2