20. Sáng Tác Với Suno

Tác giả : Ngô Càn Chiếu
07-04-2026

Prompt là gì. Cách mô tả âm nhạc để AI hiểu đúng điều bạn muốn.

Có một thay đổi rất lớn đang diễn ra trong âm nhạc hiện đại: nhiều người bắt đầu sáng tác không phải từ đàn piano, từ giấy nhạc, hay từ phòng thu, mà từ ngôn ngữ. Họ viết vài dòng mô tả, và từ những câu chữ ấy, một bài hát bắt đầu hình thành. Trong cấu trúc cuốn sách Sáng tác âm nhạc với Suno, phần đi từ ý tưởng đến bài hát hoàn chỉnh, phần viết prompt để điều khiển âm nhạc, phần tạo nhiều phiên bản và phần workflow producer AI đều cho thấy rất rõ một tư tưởng xuyên suốt: dùng AI không phải là bấm nút ngẫu nhiên, mà là biết diễn tả điều mình muốn bằng ngôn ngữ đủ đúng, đủ rõ, đủ có cảm xúc. ([filedn.eu][1])

Nói cách khác, nếu ở thời trước người sáng tác cần nhạc cụ để thử ý, thì ở thời đại này, prompt trở thành một loại nhạc cụ mới. Nó không thay thế tai nghe, cảm xúc hay óc lựa chọn của con người. Nhưng nó mở ra một con đường khác: từ cảm giác trong lòng, đi qua câu chữ, để đến âm thanh. Đó là lý do chương này rất quan trọng. Nó không chỉ dạy bạn “cách viết prompt”, mà dạy bạn một điều sâu hơn: cách nghĩ về âm nhạc bằng ngôn ngữ đời thường. ([filedn.eu][1])

1. Prompt là gì?

Nói đơn giản nhất, prompt là lời mô tả để dẫn AI đi vào đúng thế giới âm nhạc bạn muốn.

Nó không chỉ là “mệnh lệnh”. Nó cũng không nên chỉ là vài nhãn thể loại khô khan như “pop ballad”, “sad song”, “acoustic”. Nếu chỉ dừng ở đó, bạn mới nói được lớp vỏ ngoài, chứ chưa chạm vào phần hồn của bài hát. Một prompt tốt giống như bạn đang nói với một cộng sự vô hình: “Tôi muốn bài hát này có không khí gì, chuyển động ra sao, giọng hát gần hay xa, đoạn nào tâm sự, đoạn nào bùng lên, và người nghe sau khi nghe xong nên còn đọng lại điều gì.” Chính tinh thần này rất gần với các chương trong sách về phong thái, màu sắc âm nhạc, nhịp điệu, quãng, điệu thức, hòa âm và đặc biệt là chương “Viết Prompt Để Điều Khiển Âm Nhạc”.

Vì thế, prompt không phải là phần phụ của sáng tác. Trong môi trường AI, prompt chính là nơi ý tưởng mơ hồ bắt đầu có hình dạng. Nó là điểm gặp nhau giữa cảm xúc và cấu trúc. Người chưa học nhạc lý vẫn có thể viết prompt tốt, miễn là họ biết điều mình cảm là gì. Người biết nhiều thuật ngữ nhưng mô tả vô hồn vẫn có thể cho ra kết quả nhạt. Ở đây, cái quyết định không phải là vốn từ chuyên môn nhiều hay ít, mà là độ thật và độ rõ của ý tưởng âm nhạc.

2. Vì sao prompt quan trọng đến vậy?

Với Suno, bạn không trực tiếp đặt từng nốt, từng hợp âm, từng nhịp trống như trong một phần mềm làm nhạc truyền thống. Bạn đưa cho hệ thống một “khung ý niệm”, rồi AI sẽ tự suy ra một bài hát có khả năng phù hợp với khung đó. Điều này tạo ra một hệ quả rất quan trọng: prompt càng mơ hồ, kết quả càng dễ trung bình. Và đây cũng là điều mà cuốn sách của bạn nhấn mạnh ở những chương về “bẫy AI”, về việc nhạc dễ giống nhau, và về xây dựng phong cách riêng. Nếu mô tả chỉ dừng ở mức chung chung, AI sẽ kéo người dùng về vùng nghe được nhưng khó nhớ. ([filedn.eu][1])

Ngược lại, khi prompt đủ cụ thể, đủ có hình ảnh, đủ có hướng chuyển động, AI có cơ hội tạo ra kết quả gần hơn với điều bạn đang tìm. Cụ thể ở đây không nhất thiết là kỹ thuật. Nhiều khi cụ thể nhất lại là những diễn tả rất đời thường, như:

“Giọng hát nam trung, gần tai người nghe, phần verse tâm sự như kể chuyện lúc đêm muộn, điệp khúc mở rộng nhưng không quá kịch, piano và dây giữ cảm giác ấm, tiết tấu chậm, hơi thở nhiều, âm thanh sạch, không phô trương.”

Câu mô tả như vậy hữu ích không phải vì nó “cao siêu”, mà vì nó cho AI thấy: bài này là ai, đứng ở đâu, nói như thế nào, và muốn chạm vào người nghe theo cách nào.

3. Prompt không phải là nhạc lý mới. Nó là ngôn ngữ của người sáng tác trong thời đại AI

Nhiều người mới dùng Suno thường nghĩ prompt là một mẹo kỹ thuật. Họ đi tìm “câu thần chú”, tìm bộ từ khóa mạnh nhất, tìm danh sách style hiệu quả nhất. Những thứ đó có thể có ích ở một mức nào đó, nhưng nếu bạn chỉ nhìn prompt như một trò ghép tag, bạn sẽ sớm đụng trần.

Prompt thật sự không phải là sưu tập từ khóa. Prompt là một cách suy nghĩ âm nhạc.

Bạn đang học cách trả lời những câu hỏi như:

Bài này là câu chuyện hay lời thú nhận? Giọng hát này nên đứng giữa sân khấu hay sát bên tai? Verse là vùng tự sự, hay đã có nhịp chuyển động rõ? Chorus nên bùng nổ, hay chỉ mở ra một ánh sáng nhẹ? Nhạc cụ chính là piano, guitar, strings, synth, hay một chất liệu pha trộn? Bài này cần sạch, hiện đại, hay hơi mộc, hơi thở sống? Người nghe cần cảm thấy điều gì sau 20 giây đầu tiên?

Khi bạn trả lời được những câu đó, bạn không chỉ viết prompt tốt hơn. Bạn đang trở thành người sáng tác rõ hơn.

4. Cách mô tả âm nhạc: đừng nói tên quá sớm, hãy nói cảm giác trước

Một lỗi rất thường gặp là người dùng bắt đầu bằng nhãn thể loại trước, rồi dừng ở đó. Ví dụ:

“Pop ballad buồn.” “Nhạc chill.” “Bossa Nova Việt.” “Nhạc lãng mạn.”

Những nhãn này không sai. Nhưng chúng chưa đủ.

Thể loại chỉ cho biết bài hát “thuộc họ nào”. Nó chưa nói rõ bài hát “là người thế nào”. Hai bài đều là ballad có thể khác nhau hoàn toàn. Một bài thì gần gũi và thủ thỉ. Một bài thì điện ảnh và dàn trải. Một bài thì mộc như căn phòng nhỏ. Một bài thì sáng rộng như sân khấu lớn. Cho nên, khi mô tả âm nhạc cho AI, bạn nên đi theo một trật tự tự nhiên hơn:

cảm xúc trước, chuyển động sau, nhạc cụ tiếp theo, rồi mới đến nhãn thể loại nếu cần.

Thay vì viết: “Pop ballad sad”

Bạn có thể viết: “Một bài hát buồn nhưng ấm, như đang nhớ lại một người cũ trong đêm yên tĩnh. Verse rất gần, kể chuyện nhẹ nhàng. Chorus mở hơn nhưng không gào thét. Piano là nhạc cụ chính, có strings mỏng phía sau. Tempo chậm, giọng nam trung, mềm và rõ lời. Phong cách pop ballad hiện đại.”

Trong ví dụ này, chữ “pop ballad” vẫn có mặt, nhưng nó không đứng một mình. Nó được đặt vào một bức tranh cụ thể hơn.

5. Những lớp mô tả quan trọng trong một prompt tốt

Để viết prompt tốt, bạn không cần lúc nào cũng dài. Nhưng bạn nên hiểu những lớp mô tả có thể dùng. Đây là khung tư duy rất hiệu quả.

a. Lớp cảm xúc cốt lõi

Đây là phần quan trọng nhất. Nó trả lời câu hỏi: bài hát này chạm vào vùng nào của con người?

Ví dụ:

  • buồn nhưng không tuyệt vọng
  • nhớ nhưng không níu kéo
  • vui nhẹ, có nắng, có gió
  • cô đơn nhưng đẹp
  • sâu, trầm, suy tư
  • tự do, phóng khoáng, hơi bụi
  • lãng mạn, gần gũi, đời thường

Đây là phần AI rất cần, vì nó quyết định “trọng lực cảm xúc” của bài hát.

b. Lớp hình ảnh và bối cảnh

Âm nhạc rất nhạy với hình ảnh. Một prompt có hình ảnh thường giàu sức gợi hơn một prompt chỉ có tính từ.

Ví dụ:

  • như một buổi chiều mưa trong thành phố
  • như người đang lái xe một mình ban đêm
  • như ký ức trở lại trong căn phòng vắng
  • như nắng đầu ngày trên một con đường quê
  • như đứng giữa sân ga, biết ai đó sắp đi xa

Những hình ảnh này giúp AI “đặt” âm nhạc vào không gian cụ thể hơn.

c. Lớp cấu trúc cảm xúc

Bạn nên cho AI biết bài hát chuyển động như thế nào.

Ví dụ:

  • verse nhẹ và kể chuyện, chorus mở rộng
  • intro rất mộc, rồi dần thêm trống và bass
  • pre-chorus tạo cảm giác chờ đợi
  • chorus cao trào nhưng vẫn giữ sự tinh tế
  • bridge nên giảm lại để tạo một khoảng lắng trước đoạn cuối

Đây là phần cực kỳ quan trọng, vì một bài hay không chỉ do âm sắc, mà còn do cách cảm xúc được tổ chức theo thời gian.

d. Lớp chất liệu âm thanh và nhạc cụ

Bạn không cần liệt kê quá nhiều, nhưng nên chỉ ra những nhân vật chính.

Ví dụ:

  • soft piano intro
  • nylon guitar nhẹ
  • strings mỏng, không quá dày
  • drums mềm, brush hoặc light kit
  • bass ấm, không quá nổi
  • ambient pad phía sau
  • saxophone hoặc violin xuất hiện ở đoạn chuyển

Phần này giúp AI tránh đi quá xa khỏi tưởng tượng của bạn.

e. Lớp giọng hát

Nhiều người quên phần này, trong khi giọng hát là nơi cảm xúc chạm trực tiếp vào người nghe.

Bạn có thể mô tả:

  • giọng nam trung ấm
  • nữ alto khàn nhẹ
  • giọng gần, rõ lời
  • ít ad-lib
  • hát thẳng, không phô diễn
  • mềm, nhiều hơi thở
  • chorus cần nâng năng lượng nhưng không gắt

Nếu bài hát có lời Việt, yếu tố “rõ chữ”, “giữ tự nhiên”, “đừng làm giọng quá Tây” cũng có thể là các hướng mô tả hữu ích.

f. Lớp phong cách

Sau khi đã mô tả phần hồn, bạn mới gắn thêm phong cách nếu cần:

  • pop ballad
  • indie folk
  • modern bolero
  • Bossa Nova Việt
  • cinematic pop
  • lo-fi soul
  • acoustic contemporary

Phong cách ở đây giống như khung tham chiếu, không nên là toàn bộ prompt.

6. Cách mô tả hay nhất là dùng ngôn ngữ của người thật

Một trong những ưu điểm lớn nhất của phương pháp sáng tác với Suno là bạn không bị buộc phải dùng toàn thuật ngữ nhạc lý phương Tây. Bạn hoàn toàn có thể mô tả bằng ngôn ngữ của người sống trong cảm xúc. Đây cũng là tinh thần xuyên suốt của cuốn sách: âm nhạc đến từ cảm nhận của người nghe, người hát, người sáng tạo, và trong thời đại AI, điều quyết định không còn chỉ là biết nhiều lý thuyết, mà là biết diễn tả cái thật trong lòng mình bằng ngôn ngữ đời thường.

Thay vì nói:

  • dùng mode này, interval kia, chord progression nọ

Bạn có thể nói:

  • nghe như đang nhớ
  • mở ra như bầu trời
  • gần như lời thủ thỉ
  • điệp khúc phải nở ra, nhưng vẫn giữ sự chân thành
  • đừng quá dày, để người nghe còn thở được
  • có chút cổ điển nhưng vẫn hiện đại
  • như nhạc Việt nhưng phối khí đương đại

Chính những câu như thế thường làm prompt giàu hồn hơn.

7. Những lỗi thường gặp khi viết prompt

a. Quá ngắn và quá chung

Ví dụ: “sad ballad” “beautiful song” “romantic music”

Những prompt như vậy không sai, nhưng rất dễ dẫn đến kết quả chung chung.

b. Quá tham

Ví dụ: “Bolero, jazz, rock, orchestral, EDM, cinematic, folk, dreamy, epic, danceable, emotional.”

Khi bạn ném quá nhiều hướng cùng lúc, AI khó biết điều gì là trục chính. Kết quả có thể nghe pha tạp nhưng thiếu linh hồn.

c. Chỉ mô tả thể loại mà không mô tả cảm xúc

Thể loại là bề ngoài. Cảm xúc mới là lõi.

d. Chỉ mô tả cảm xúc mà không mô tả chuyển động

Ví dụ chỉ viết “buồn, nhớ, sâu” mà không nói verse ra sao, chorus ra sao, nhạc cụ thế nào. Khi đó, bài dễ có màu đúng nhưng cấu trúc yếu.

e. Mô tả mâu thuẫn nhau

Ví dụ: “rất intimate nhưng cực kỳ stadium anthem” “rất mộc nhưng synth dày đặc và production khổng lồ”

Đôi khi mâu thuẫn có thể tạo cá tính. Nhưng nếu không chủ ý rõ, nó sẽ làm prompt lạc hướng.

8. Một prompt tốt thường có ba phẩm chất

Thứ nhất, rõ ý. Người đọc prompt phải biết bài hát này đang hướng tới điều gì.

Thứ hai, có hình ảnh. Không phải chỉ toàn nhãn và tính từ trừu tượng.

Thứ ba, có ưu tiên. Tức là có cái gì là trung tâm, cái gì là phụ. Ví dụ: trung tâm là giọng hát gần và lời kể, phần còn lại chỉ hỗ trợ.

9. Từ prompt đến nhiều phiên bản: đừng tìm một bản đúng duy nhất

Một ý rất hay trong cấu trúc cuốn sách là chương về tạo nhiều version và chọn bản tốt nhất. Đây là tư duy rất đúng khi làm việc với Suno. Prompt không phải là phép màu khiến bài đầu tiên đã hoàn hảo. Prompt là cách bạn mở ra một vùng tìm kiếm. Từ đó, bạn nghe, chọn, chỉnh, viết lại, thử tiếp. Cuối cùng, bạn không “nhận bài hát từ AI” một cách thụ động. Bạn dẫn dắt một quá trình chọn lọc sáng tạo. ([filedn.eu][1])

Điều này rất quan trọng với người mới. Đừng thất vọng nếu lần đầu chưa ra đúng. Hãy nghĩ như một producer. Bạn đang thử nhiều cách kể cùng một câu chuyện. Có bản gần hơn với điều bạn muốn, có bản đi sai. Chính việc nghe lại và viết prompt tốt hơn làm cho bạn tiến bộ.

10. Một số mẫu prompt theo tư duy cảm xúc

Dưới đây là vài ví dụ theo đúng tinh thần “mô tả âm nhạc bằng ngôn ngữ đời thường”.

Ví dụ 1: Ballad Việt sâu, gần

Một bài pop ballad Việt Nam rất gần gũi và chân thành. Verse nhẹ như lời tâm sự đêm khuya, piano ấm là nhạc cụ chính, giọng nam trung mềm, rõ lời, nhiều hơi thở. Chorus mở rộng hơn nhưng không gào, có strings mỏng nâng cảm xúc. Tempo chậm, sạch, hiện đại, cảm giác nhớ một người cũ nhưng không bi lụy.

Ví dụ 2: Bossa Nova Việt

Một bài hát Việt phong cách Bossa Nova nhẹ, ấm và tinh tế. Guitar nylon giữ nhịp mềm, bass nhẹ, percussion rất kín. Giọng hát thân mật, tự nhiên, như đang hát gần tai. Cảm giác thành phố chiều muộn, có gió, có nắng nhẹ, có chút nhớ nhưng vẫn thanh thản. Chorus chỉ mở thêm một chút, không quá bùng nổ.

Ví dụ 3: Dân gian đương đại

Một bài hát mang màu dân gian Việt nhưng phối khí hiện đại. Giai điệu mộc, gần dân ca, lời kể đời thường. Verse tiết chế, có không gian, nhạc cụ chính là đàn dây mộc và nền pad nhẹ. Chorus mở sáng hơn nhưng vẫn giữ hồn Việt. Không quá Tây, không quá dày, giữ sự trong trẻo và cảm giác truyền miệng.

Những ví dụ này không phải khuôn cố định. Chúng chỉ cho thấy cách kết hợp cảm xúc, hình ảnh, giọng hát, cấu trúc, nhạc cụ và phong cách trong cùng một prompt.

11. Khi nào prompt ngắn là tốt?

Prompt ngắn vẫn có thể tốt, nếu bạn đã biết rất rõ trục chính. Ví dụ:

  • Vietnamese intimate piano ballad, soft male baritone, late-night reflective mood, gentle chorus lift.
  • Warm Bossa Nova with Vietnamese melodic feel, nylon guitar, close vocal, elegant and wistful.

Loại prompt này hữu ích khi bạn đã có thói quen thử nhiều lần và muốn thay đổi nhanh một vài yếu tố. Nhưng với người mới, prompt dài vừa phải thường tốt hơn vì nó giúp bạn nghĩ rõ hơn.

12. Sáng tác với Suno thực chất là học cách nghe và diễn tả

Đi đến cuối chương này, điều quan trọng nhất không phải là bạn nhớ bao nhiêu mẫu prompt. Điều quan trọng nhất là bạn hiểu một nguyên lý:

Suno không thay bạn cảm. Suno chỉ giúp bạn biến điều đã cảm thành âm thanh nhanh hơn.

Muốn dùng Suno tốt, bạn phải học hai kỹ năng song song. Một là nghe sâu hơn để biết bài nào đúng, bài nào sai với điều mình muốn. Hai là diễn tả rõ hơn để AI có đủ dữ liệu cảm xúc và cấu trúc mà đi đúng hướng.

Vì vậy, sáng tác với Suno không phải là bỏ qua tư duy âm nhạc. Ngược lại, nó buộc bạn phải đối diện trực tiếp với câu hỏi quan trọng nhất của người sáng tác:

Tôi thật sự muốn nói điều gì, và muốn nó vang lên như thế nào?


Bài tập thực hành

Bài 1. Hãy chọn một cảm xúc rất thật của bạn trong hôm nay. Ví dụ: nhớ, nhẹ nhõm, hụt hẫng, hy vọng, cô đơn, bình yên. Sau đó viết 3 dòng mô tả âm nhạc tương ứng, không dùng tên nốt và không dùng thuật ngữ khó.

Bài 2. Viết lại cùng một ý tưởng theo hai cách:

  • cách 1: chỉ ghi thể loại
  • cách 2: ghi cảm xúc, hình ảnh, giọng hát, nhạc cụ, cấu trúc

So sánh xem phiên bản nào rõ hơn.

Bài 3. Hãy viết 2 prompt cho cùng một chủ đề “nhớ người cũ”:

  • một prompt theo hướng rất gần gũi, mộc
  • một prompt theo hướng điện ảnh, rộng

Bài 4. Chọn một bài hát Việt bạn thích. Đừng phân tích nốt. Hãy mô tả nó bằng lời đời thường: bài này gần hay xa, sáng hay tối, chorus nở ra hay giữ kín, giọng hát thủ thỉ hay bùng lên.

Bài 5. Nếu đã dùng Suno, hãy thử tạo 3 phiên bản từ cùng một prompt, rồi ghi lại:

  • bản nào gần nhất với điều bạn muốn
  • bản nào có chorus tốt nhất
  • bản nào có giọng hát hợp nhất

Trắc nghiệm

📝 Trắc nghiệm — Prompt & sáng tác với AI
1. Trong phần này, prompt được hiểu gần nhất là gì?
  • A Một công thức hòa âm cố định
  • B Một bản nhạc đã hoàn chỉnh
  • C Lời mô tả để dẫn AI đi vào thế giới âm nhạc bạn muốn
  • D Danh sách nốt nhạc cho bài hát
2. Một prompt tốt không nên chỉ gồm:
  • A Cảm xúc và hình ảnh
  • B Cấu trúc và giọng hát
  • C Nhãn thể loại chung chung
  • D Mô tả nhạc cụ và không khí
3. Điều nào quan trọng nhất khi viết prompt?
  • A Dùng càng nhiều thuật ngữ nhạc lý càng tốt
  • B Diễn tả rõ cảm xúc và hướng chuyển động của bài hát
  • C Liệt kê thật nhiều thể loại khác nhau
  • D Chỉ cần ghi tempo và tên nhạc cụ
4. Lớp mô tả nào là cốt lõi nhất của prompt?
  • A Kích thước màn hình
  • B Tên phần mềm chỉnh sửa
  • C Cảm xúc cốt lõi của bài hát
  • D Số lượng người nghe dự kiến
5. Vì sao cùng là “ballad” nhưng hai bài hát có thể rất khác nhau?
  • A Vì ballad luôn có nhiều nốt hơn
  • B Vì thể loại chỉ là lớp ngoài, còn cảm xúc và cách mô tả mới quyết định bản sắc
  • C Vì mọi bài ballad đều giống nhau
  • D Vì ballad không cần giọng hát
6. Điều nào sau đây là một lỗi thường gặp khi viết prompt?
  • A Mô tả bằng hình ảnh đời thường
  • B Nêu rõ vai trò của verse và chorus
  • C Chỉ viết “sad ballad” rồi dừng lại
  • D Mô tả giọng hát gần hay xa
7. Cách tiếp cận đúng khi dùng Suno là gì?
  • A Tìm một prompt thần chú rồi dùng mãi
  • B Tạo một bản duy nhất và coi đó là kết quả cuối cùng
  • C Viết prompt, thử nhiều phiên bản, nghe lại và chọn lọc
  • D Không cần nghe lại vì AI đã tự làm hết
8. Câu nào dưới đây phù hợp hơn với tinh thần “mô tả bằng ngôn ngữ đời thường”?
  • A Use only advanced modal interchange and polymetric syncopation
  • B A=440, twelve-tone equal temperament, strict tertiary voicing
  • C Buồn nhưng ấm, như nhớ lại một người cũ trong đêm yên tĩnh
  • D Dominant substitution with chromatic upper structures only
9. Một prompt tốt thường cần có điều gì?
  • A Rõ ý, có hình ảnh, có ưu tiên
  • B Càng ngắn càng tốt trong mọi trường hợp
  • C Càng dài càng tốt trong mọi trường hợp
  • D Chỉ cần đúng tên thể loại
10. Ý quan trọng nhất của phần này là gì?
  • A Sáng tác với AI không cần cảm xúc thật
  • B Prompt chỉ là mẹo kỹ thuật
  • C Dùng Suno tốt là học cách nghe sâu hơn và diễn tả rõ hơn
  • D Chỉ người giỏi nhạc lý phương Tây mới viết prompt tốt