20. Sáng Tác Với Suno
Prompt là gì. Cách mô tả âm nhạc để AI hiểu đúng điều bạn muốn.
Có một thay đổi rất lớn đang diễn ra trong âm nhạc hiện đại: nhiều người bắt đầu sáng tác không phải từ đàn piano, từ giấy nhạc, hay từ phòng thu, mà từ ngôn ngữ. Họ viết vài dòng mô tả, và từ những câu chữ ấy, một bài hát bắt đầu hình thành. Trong cấu trúc cuốn sách Sáng tác âm nhạc với Suno, phần đi từ ý tưởng đến bài hát hoàn chỉnh, phần viết prompt để điều khiển âm nhạc, phần tạo nhiều phiên bản và phần workflow producer AI đều cho thấy rất rõ một tư tưởng xuyên suốt: dùng AI không phải là bấm nút ngẫu nhiên, mà là biết diễn tả điều mình muốn bằng ngôn ngữ đủ đúng, đủ rõ, đủ có cảm xúc. ([filedn.eu][1])
Nói cách khác, nếu ở thời trước người sáng tác cần nhạc cụ để thử ý, thì ở thời đại này, prompt trở thành một loại nhạc cụ mới. Nó không thay thế tai nghe, cảm xúc hay óc lựa chọn của con người. Nhưng nó mở ra một con đường khác: từ cảm giác trong lòng, đi qua câu chữ, để đến âm thanh. Đó là lý do chương này rất quan trọng. Nó không chỉ dạy bạn “cách viết prompt”, mà dạy bạn một điều sâu hơn: cách nghĩ về âm nhạc bằng ngôn ngữ đời thường. ([filedn.eu][1])
1. Prompt là gì?
Nói đơn giản nhất, prompt là lời mô tả để dẫn AI đi vào đúng thế giới âm nhạc bạn muốn.
Nó không chỉ là “mệnh lệnh”. Nó cũng không nên chỉ là vài nhãn thể loại khô khan như “pop ballad”, “sad song”, “acoustic”. Nếu chỉ dừng ở đó, bạn mới nói được lớp vỏ ngoài, chứ chưa chạm vào phần hồn của bài hát. Một prompt tốt giống như bạn đang nói với một cộng sự vô hình: “Tôi muốn bài hát này có không khí gì, chuyển động ra sao, giọng hát gần hay xa, đoạn nào tâm sự, đoạn nào bùng lên, và người nghe sau khi nghe xong nên còn đọng lại điều gì.” Chính tinh thần này rất gần với các chương trong sách về phong thái, màu sắc âm nhạc, nhịp điệu, quãng, điệu thức, hòa âm và đặc biệt là chương “Viết Prompt Để Điều Khiển Âm Nhạc”.
Vì thế, prompt không phải là phần phụ của sáng tác. Trong môi trường AI, prompt chính là nơi ý tưởng mơ hồ bắt đầu có hình dạng. Nó là điểm gặp nhau giữa cảm xúc và cấu trúc. Người chưa học nhạc lý vẫn có thể viết prompt tốt, miễn là họ biết điều mình cảm là gì. Người biết nhiều thuật ngữ nhưng mô tả vô hồn vẫn có thể cho ra kết quả nhạt. Ở đây, cái quyết định không phải là vốn từ chuyên môn nhiều hay ít, mà là độ thật và độ rõ của ý tưởng âm nhạc.
2. Vì sao prompt quan trọng đến vậy?
Với Suno, bạn không trực tiếp đặt từng nốt, từng hợp âm, từng nhịp trống như trong một phần mềm làm nhạc truyền thống. Bạn đưa cho hệ thống một “khung ý niệm”, rồi AI sẽ tự suy ra một bài hát có khả năng phù hợp với khung đó. Điều này tạo ra một hệ quả rất quan trọng: prompt càng mơ hồ, kết quả càng dễ trung bình. Và đây cũng là điều mà cuốn sách của bạn nhấn mạnh ở những chương về “bẫy AI”, về việc nhạc dễ giống nhau, và về xây dựng phong cách riêng. Nếu mô tả chỉ dừng ở mức chung chung, AI sẽ kéo người dùng về vùng nghe được nhưng khó nhớ. ([filedn.eu][1])
Ngược lại, khi prompt đủ cụ thể, đủ có hình ảnh, đủ có hướng chuyển động, AI có cơ hội tạo ra kết quả gần hơn với điều bạn đang tìm. Cụ thể ở đây không nhất thiết là kỹ thuật. Nhiều khi cụ thể nhất lại là những diễn tả rất đời thường, như:
“Giọng hát nam trung, gần tai người nghe, phần verse tâm sự như kể chuyện lúc đêm muộn, điệp khúc mở rộng nhưng không quá kịch, piano và dây giữ cảm giác ấm, tiết tấu chậm, hơi thở nhiều, âm thanh sạch, không phô trương.”
Câu mô tả như vậy hữu ích không phải vì nó “cao siêu”, mà vì nó cho AI thấy: bài này là ai, đứng ở đâu, nói như thế nào, và muốn chạm vào người nghe theo cách nào.
3. Prompt không phải là nhạc lý mới. Nó là ngôn ngữ của người sáng tác trong thời đại AI
Nhiều người mới dùng Suno thường nghĩ prompt là một mẹo kỹ thuật. Họ đi tìm “câu thần chú”, tìm bộ từ khóa mạnh nhất, tìm danh sách style hiệu quả nhất. Những thứ đó có thể có ích ở một mức nào đó, nhưng nếu bạn chỉ nhìn prompt như một trò ghép tag, bạn sẽ sớm đụng trần.
Prompt thật sự không phải là sưu tập từ khóa. Prompt là một cách suy nghĩ âm nhạc.
Bạn đang học cách trả lời những câu hỏi như:
Bài này là câu chuyện hay lời thú nhận? Giọng hát này nên đứng giữa sân khấu hay sát bên tai? Verse là vùng tự sự, hay đã có nhịp chuyển động rõ? Chorus nên bùng nổ, hay chỉ mở ra một ánh sáng nhẹ? Nhạc cụ chính là piano, guitar, strings, synth, hay một chất liệu pha trộn? Bài này cần sạch, hiện đại, hay hơi mộc, hơi thở sống? Người nghe cần cảm thấy điều gì sau 20 giây đầu tiên?
Khi bạn trả lời được những câu đó, bạn không chỉ viết prompt tốt hơn. Bạn đang trở thành người sáng tác rõ hơn.
4. Cách mô tả âm nhạc: đừng nói tên quá sớm, hãy nói cảm giác trước
Một lỗi rất thường gặp là người dùng bắt đầu bằng nhãn thể loại trước, rồi dừng ở đó. Ví dụ:
“Pop ballad buồn.” “Nhạc chill.” “Bossa Nova Việt.” “Nhạc lãng mạn.”
Những nhãn này không sai. Nhưng chúng chưa đủ.
Thể loại chỉ cho biết bài hát “thuộc họ nào”. Nó chưa nói rõ bài hát “là người thế nào”. Hai bài đều là ballad có thể khác nhau hoàn toàn. Một bài thì gần gũi và thủ thỉ. Một bài thì điện ảnh và dàn trải. Một bài thì mộc như căn phòng nhỏ. Một bài thì sáng rộng như sân khấu lớn. Cho nên, khi mô tả âm nhạc cho AI, bạn nên đi theo một trật tự tự nhiên hơn:
cảm xúc trước, chuyển động sau, nhạc cụ tiếp theo, rồi mới đến nhãn thể loại nếu cần.
Thay vì viết: “Pop ballad sad”
Bạn có thể viết: “Một bài hát buồn nhưng ấm, như đang nhớ lại một người cũ trong đêm yên tĩnh. Verse rất gần, kể chuyện nhẹ nhàng. Chorus mở hơn nhưng không gào thét. Piano là nhạc cụ chính, có strings mỏng phía sau. Tempo chậm, giọng nam trung, mềm và rõ lời. Phong cách pop ballad hiện đại.”
Trong ví dụ này, chữ “pop ballad” vẫn có mặt, nhưng nó không đứng một mình. Nó được đặt vào một bức tranh cụ thể hơn.
5. Những lớp mô tả quan trọng trong một prompt tốt
Để viết prompt tốt, bạn không cần lúc nào cũng dài. Nhưng bạn nên hiểu những lớp mô tả có thể dùng. Đây là khung tư duy rất hiệu quả.
a. Lớp cảm xúc cốt lõi
Đây là phần quan trọng nhất. Nó trả lời câu hỏi: bài hát này chạm vào vùng nào của con người?
Ví dụ:
- buồn nhưng không tuyệt vọng
- nhớ nhưng không níu kéo
- vui nhẹ, có nắng, có gió
- cô đơn nhưng đẹp
- sâu, trầm, suy tư
- tự do, phóng khoáng, hơi bụi
- lãng mạn, gần gũi, đời thường
Đây là phần AI rất cần, vì nó quyết định “trọng lực cảm xúc” của bài hát.
b. Lớp hình ảnh và bối cảnh
Âm nhạc rất nhạy với hình ảnh. Một prompt có hình ảnh thường giàu sức gợi hơn một prompt chỉ có tính từ.
Ví dụ:
- như một buổi chiều mưa trong thành phố
- như người đang lái xe một mình ban đêm
- như ký ức trở lại trong căn phòng vắng
- như nắng đầu ngày trên một con đường quê
- như đứng giữa sân ga, biết ai đó sắp đi xa
Những hình ảnh này giúp AI “đặt” âm nhạc vào không gian cụ thể hơn.
c. Lớp cấu trúc cảm xúc
Bạn nên cho AI biết bài hát chuyển động như thế nào.
Ví dụ:
- verse nhẹ và kể chuyện, chorus mở rộng
- intro rất mộc, rồi dần thêm trống và bass
- pre-chorus tạo cảm giác chờ đợi
- chorus cao trào nhưng vẫn giữ sự tinh tế
- bridge nên giảm lại để tạo một khoảng lắng trước đoạn cuối
Đây là phần cực kỳ quan trọng, vì một bài hay không chỉ do âm sắc, mà còn do cách cảm xúc được tổ chức theo thời gian.
d. Lớp chất liệu âm thanh và nhạc cụ
Bạn không cần liệt kê quá nhiều, nhưng nên chỉ ra những nhân vật chính.
Ví dụ:
- soft piano intro
- nylon guitar nhẹ
- strings mỏng, không quá dày
- drums mềm, brush hoặc light kit
- bass ấm, không quá nổi
- ambient pad phía sau
- saxophone hoặc violin xuất hiện ở đoạn chuyển
Phần này giúp AI tránh đi quá xa khỏi tưởng tượng của bạn.
e. Lớp giọng hát
Nhiều người quên phần này, trong khi giọng hát là nơi cảm xúc chạm trực tiếp vào người nghe.
Bạn có thể mô tả:
- giọng nam trung ấm
- nữ alto khàn nhẹ
- giọng gần, rõ lời
- ít ad-lib
- hát thẳng, không phô diễn
- mềm, nhiều hơi thở
- chorus cần nâng năng lượng nhưng không gắt
Nếu bài hát có lời Việt, yếu tố “rõ chữ”, “giữ tự nhiên”, “đừng làm giọng quá Tây” cũng có thể là các hướng mô tả hữu ích.
f. Lớp phong cách
Sau khi đã mô tả phần hồn, bạn mới gắn thêm phong cách nếu cần:
- pop ballad
- indie folk
- modern bolero
- Bossa Nova Việt
- cinematic pop
- lo-fi soul
- acoustic contemporary
Phong cách ở đây giống như khung tham chiếu, không nên là toàn bộ prompt.
6. Cách mô tả hay nhất là dùng ngôn ngữ của người thật
Một trong những ưu điểm lớn nhất của phương pháp sáng tác với Suno là bạn không bị buộc phải dùng toàn thuật ngữ nhạc lý phương Tây. Bạn hoàn toàn có thể mô tả bằng ngôn ngữ của người sống trong cảm xúc. Đây cũng là tinh thần xuyên suốt của cuốn sách: âm nhạc đến từ cảm nhận của người nghe, người hát, người sáng tạo, và trong thời đại AI, điều quyết định không còn chỉ là biết nhiều lý thuyết, mà là biết diễn tả cái thật trong lòng mình bằng ngôn ngữ đời thường.
Thay vì nói:
- dùng mode này, interval kia, chord progression nọ
Bạn có thể nói:
- nghe như đang nhớ
- mở ra như bầu trời
- gần như lời thủ thỉ
- điệp khúc phải nở ra, nhưng vẫn giữ sự chân thành
- đừng quá dày, để người nghe còn thở được
- có chút cổ điển nhưng vẫn hiện đại
- như nhạc Việt nhưng phối khí đương đại
Chính những câu như thế thường làm prompt giàu hồn hơn.
7. Những lỗi thường gặp khi viết prompt
a. Quá ngắn và quá chung
Ví dụ: “sad ballad” “beautiful song” “romantic music”
Những prompt như vậy không sai, nhưng rất dễ dẫn đến kết quả chung chung.
b. Quá tham
Ví dụ: “Bolero, jazz, rock, orchestral, EDM, cinematic, folk, dreamy, epic, danceable, emotional.”
Khi bạn ném quá nhiều hướng cùng lúc, AI khó biết điều gì là trục chính. Kết quả có thể nghe pha tạp nhưng thiếu linh hồn.
c. Chỉ mô tả thể loại mà không mô tả cảm xúc
Thể loại là bề ngoài. Cảm xúc mới là lõi.
d. Chỉ mô tả cảm xúc mà không mô tả chuyển động
Ví dụ chỉ viết “buồn, nhớ, sâu” mà không nói verse ra sao, chorus ra sao, nhạc cụ thế nào. Khi đó, bài dễ có màu đúng nhưng cấu trúc yếu.
e. Mô tả mâu thuẫn nhau
Ví dụ: “rất intimate nhưng cực kỳ stadium anthem” “rất mộc nhưng synth dày đặc và production khổng lồ”
Đôi khi mâu thuẫn có thể tạo cá tính. Nhưng nếu không chủ ý rõ, nó sẽ làm prompt lạc hướng.
8. Một prompt tốt thường có ba phẩm chất
Thứ nhất, rõ ý. Người đọc prompt phải biết bài hát này đang hướng tới điều gì.
Thứ hai, có hình ảnh. Không phải chỉ toàn nhãn và tính từ trừu tượng.
Thứ ba, có ưu tiên. Tức là có cái gì là trung tâm, cái gì là phụ. Ví dụ: trung tâm là giọng hát gần và lời kể, phần còn lại chỉ hỗ trợ.
9. Từ prompt đến nhiều phiên bản: đừng tìm một bản đúng duy nhất
Một ý rất hay trong cấu trúc cuốn sách là chương về tạo nhiều version và chọn bản tốt nhất. Đây là tư duy rất đúng khi làm việc với Suno. Prompt không phải là phép màu khiến bài đầu tiên đã hoàn hảo. Prompt là cách bạn mở ra một vùng tìm kiếm. Từ đó, bạn nghe, chọn, chỉnh, viết lại, thử tiếp. Cuối cùng, bạn không “nhận bài hát từ AI” một cách thụ động. Bạn dẫn dắt một quá trình chọn lọc sáng tạo. ([filedn.eu][1])
Điều này rất quan trọng với người mới. Đừng thất vọng nếu lần đầu chưa ra đúng. Hãy nghĩ như một producer. Bạn đang thử nhiều cách kể cùng một câu chuyện. Có bản gần hơn với điều bạn muốn, có bản đi sai. Chính việc nghe lại và viết prompt tốt hơn làm cho bạn tiến bộ.
10. Một số mẫu prompt theo tư duy cảm xúc
Dưới đây là vài ví dụ theo đúng tinh thần “mô tả âm nhạc bằng ngôn ngữ đời thường”.
Ví dụ 1: Ballad Việt sâu, gần
Một bài pop ballad Việt Nam rất gần gũi và chân thành. Verse nhẹ như lời tâm sự đêm khuya, piano ấm là nhạc cụ chính, giọng nam trung mềm, rõ lời, nhiều hơi thở. Chorus mở rộng hơn nhưng không gào, có strings mỏng nâng cảm xúc. Tempo chậm, sạch, hiện đại, cảm giác nhớ một người cũ nhưng không bi lụy.
Ví dụ 2: Bossa Nova Việt
Một bài hát Việt phong cách Bossa Nova nhẹ, ấm và tinh tế. Guitar nylon giữ nhịp mềm, bass nhẹ, percussion rất kín. Giọng hát thân mật, tự nhiên, như đang hát gần tai. Cảm giác thành phố chiều muộn, có gió, có nắng nhẹ, có chút nhớ nhưng vẫn thanh thản. Chorus chỉ mở thêm một chút, không quá bùng nổ.
Ví dụ 3: Dân gian đương đại
Một bài hát mang màu dân gian Việt nhưng phối khí hiện đại. Giai điệu mộc, gần dân ca, lời kể đời thường. Verse tiết chế, có không gian, nhạc cụ chính là đàn dây mộc và nền pad nhẹ. Chorus mở sáng hơn nhưng vẫn giữ hồn Việt. Không quá Tây, không quá dày, giữ sự trong trẻo và cảm giác truyền miệng.
Những ví dụ này không phải khuôn cố định. Chúng chỉ cho thấy cách kết hợp cảm xúc, hình ảnh, giọng hát, cấu trúc, nhạc cụ và phong cách trong cùng một prompt.
11. Khi nào prompt ngắn là tốt?
Prompt ngắn vẫn có thể tốt, nếu bạn đã biết rất rõ trục chính. Ví dụ:
- Vietnamese intimate piano ballad, soft male baritone, late-night reflective mood, gentle chorus lift.
- Warm Bossa Nova with Vietnamese melodic feel, nylon guitar, close vocal, elegant and wistful.
Loại prompt này hữu ích khi bạn đã có thói quen thử nhiều lần và muốn thay đổi nhanh một vài yếu tố. Nhưng với người mới, prompt dài vừa phải thường tốt hơn vì nó giúp bạn nghĩ rõ hơn.
12. Sáng tác với Suno thực chất là học cách nghe và diễn tả
Đi đến cuối chương này, điều quan trọng nhất không phải là bạn nhớ bao nhiêu mẫu prompt. Điều quan trọng nhất là bạn hiểu một nguyên lý:
Suno không thay bạn cảm. Suno chỉ giúp bạn biến điều đã cảm thành âm thanh nhanh hơn.
Muốn dùng Suno tốt, bạn phải học hai kỹ năng song song. Một là nghe sâu hơn để biết bài nào đúng, bài nào sai với điều mình muốn. Hai là diễn tả rõ hơn để AI có đủ dữ liệu cảm xúc và cấu trúc mà đi đúng hướng.
Vì vậy, sáng tác với Suno không phải là bỏ qua tư duy âm nhạc. Ngược lại, nó buộc bạn phải đối diện trực tiếp với câu hỏi quan trọng nhất của người sáng tác:
Tôi thật sự muốn nói điều gì, và muốn nó vang lên như thế nào?
Bài tập thực hành
Bài 1. Hãy chọn một cảm xúc rất thật của bạn trong hôm nay. Ví dụ: nhớ, nhẹ nhõm, hụt hẫng, hy vọng, cô đơn, bình yên. Sau đó viết 3 dòng mô tả âm nhạc tương ứng, không dùng tên nốt và không dùng thuật ngữ khó.
Bài 2. Viết lại cùng một ý tưởng theo hai cách:
- cách 1: chỉ ghi thể loại
- cách 2: ghi cảm xúc, hình ảnh, giọng hát, nhạc cụ, cấu trúc
So sánh xem phiên bản nào rõ hơn.
Bài 3. Hãy viết 2 prompt cho cùng một chủ đề “nhớ người cũ”:
- một prompt theo hướng rất gần gũi, mộc
- một prompt theo hướng điện ảnh, rộng
Bài 4. Chọn một bài hát Việt bạn thích. Đừng phân tích nốt. Hãy mô tả nó bằng lời đời thường: bài này gần hay xa, sáng hay tối, chorus nở ra hay giữ kín, giọng hát thủ thỉ hay bùng lên.
Bài 5. Nếu đã dùng Suno, hãy thử tạo 3 phiên bản từ cùng một prompt, rồi ghi lại:
- bản nào gần nhất với điều bạn muốn
- bản nào có chorus tốt nhất
- bản nào có giọng hát hợp nhất