سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
آیکون جستجو در سایت سافت گذر
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. به مناسبت ماه رجب، در سایت https://esetupdate.ir/ تخفیف ویژه‌ای برای محصولات در نظر گرفته شده است؛ فرصت را از دست ندهید. 🌸
  3. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

در ماه‌های اخیر، OpenAI چندین ابزار جدید از جمله Operator، Deep Research، Computer-Using Agents و Responses API را منتشر کرده که بر روی عامل‌های متنی متمرکز بوده‌اند. امروز، OpenAI مدل‌های جدید تبدیل گفتار به متن و متن به گفتار را در API خود اعلام کرد که به توسعه‌دهندگان امکان می‌دهد عامل‌های صوتی قدرتمندتر، قابل شخصی‌سازی‌تر و بیانگرتر از همیشه بسازند.

 

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

 

مدل‌های جدید تبدیل گفتار به متن OpenAI، gpt-4o-transcribe و gpt-4o-mini-transcribe، بهبودهای قابل توجهی در نرخ خطای کلمات، تشخیص زبان و دقت در مقایسه با مدل‌های Whisper موجود OpenAI ارائه می‌دهند. این پیشرفت‌ها از طریق یادگیری تقویتی و آموزش میانی گسترده با استفاده از مجموعه داده‌های صوتی متنوع و با کیفیت بالا به دست آمده است.

OpenAI ادعا می‌کند که این مدل‌های صوتی جدید می‌توانند ظرافت‌های گفتار را بهتر درک کنند، تشخیص‌های نادرست را کاهش دهند و قابلیت اطمینان رونویسی را حتی زمانی که صدای ورودی شامل لهجه‌ها، محیط‌های پر سر و صدا و سرعت‌های مختلف گفتار است، بهبود بخشند.

gpt-4o-mini-tts جدیدترین مدل تبدیل متن به گفتار است که قابلیت هدایت بهبود یافته‌ای را ارائه می‌دهد. توسعه‌دهندگان اکنون می‌توانند به مدل دستور دهند که چگونه محتوای متن را تلفظ کند. با این حال، فعلاً مدل تبدیل متن به گفتار به صداهای مصنوعی از پیش تعیین شده محدود است.

هزینه‌های مدل‌ها به شرح زیر است: مدل gpt-4o-transcribe: ۶ دلار برای هر میلیون توکن صوتی ورودی، ۲.۵۰ دلار برای هر میلیون توکن متنی ورودی و ۱۰ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-transcribe: ۳ دلار برای هر میلیون توکن صوتی ورودی، ۱.۲۵ دلار برای هر میلیون توکن متنی ورودی و ۵ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-tts: ۰.۶۰ دلار برای هر میلیون توکن متنی ورودی و ۱۲ دلار برای هر میلیون توکن صوتی خروجی

 

این هزینه‌ها به صورت دقیقه‌ای به شرح زیر محاسبه می‌شود:

  • gpt-4o-transcribe: حدود ۰.۶ سنت در دقیقه
  • gpt-4o-mini-transcribe: حدود ۰.۳ سنت در دقیقه
  • gpt-4o-mini-tts: حدود ۱.۵ سنت در دقیقه

تیم OpenAI درباره این مدل‌های صوتی جدید نوشت: “در آینده، ما قصد داریم به سرمایه‌گذاری در بهبود هوشمندی و دقت مدل‌های صوتی خود ادامه دهیم و راه‌هایی را برای اجازه دادن به توسعه‌دهندگان برای آوردن صداهای سفارشی خود جهت ساخت تجربیات شخصی‌سازی شده‌تر، به روش‌هایی که با استانداردهای ایمنی ما مطابقت دارند، بررسی کنیم.”

این مدل‌های صوتی جدید اکنون از طریق APIها برای همه توسعه‌دهندگان در دسترس هستند. OpenAI همچنین یک ادغام با Agents SDK را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد به راحتی عامل‌های صوتی بسازند. برای تجربیات گفتار به گفتار با تأخیر کم، OpenAI استفاده از Realtime API را توصیه می‌کند.

نظرتان را ثبت کنید کد خبر: 52463 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/03 تعداد مشاهده: 2788
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
Dungeon Nightmares II - The Memory

Dungeon Nightmares II - The Memory

کابوس‌های سیاهچال 2 - حافظه

Apple Safari 5.34.57.2 / Preview 235 Final

Apple Safari 5.34.57.2 / Preview 235 Final

مرورگر پرسرعت، زیبا و قدرتمند شرکت Apple

 مجموعه‌ی 100 بازی جذاب اندروید

مجموعه‌ی 100 بازی جذاب اندروید

مجموعه‌ی 100 بازی جذاب اندروید

Rohos Logon Key 5.3

Rohos Logon Key 5.3

قفل کامپیوتر با فلش مموری

Bear Simulator

Bear Simulator

شبیه‌ساز خرس

OneNote 16.0.19127.20320 for Android +11.0

OneNote 16.0.19127.20320 for Android +11.0

وان نوت

Wise Disk Cleaner 11.3.1.851

Wise Disk Cleaner 11.3.1.851

پاکسازی فضای هارد از فایل های اضافی

Zombie Tsunami 4.5.130 for Android +4.4

Zombie Tsunami 4.5.130 for Android +4.4

بازی تسونامی زامبی ها

آموزش آسان و کاربردی php و mysql (ویرایش اردیبهشت 93)

آموزش آسان و کاربردی php و mysql (ویرایش اردیبهشت 93)

آموزش php و mysql

تفسیر صوتی سوره التین و کوثر

تفسیر صوتی سوره التین و کوثر

تفسیر سوره کوثر از حجت الاسلام قرائتی

GO Launcher Fonts 3.6 for Android +2.0

GO Launcher Fonts 3.6 for Android +2.0

فونت برای لانچر GO Launcher

Video Speed Slow Motion & Fast Premium 1.79 for Android +5.0

Video Speed Slow Motion & Fast Premium 1.79 for Android +5.0

ویرایش گر سرعت ویدئو

MacroDroid – Device Automation Pro 5.59.12 For Android +5.0

MacroDroid – Device Automation Pro 5.59.12 For Android +5.0

ماکرودروید

Microsoft Windows Server 2008 R2 SP1

Microsoft Windows Server 2008 R2 SP1

نسخه اصلی Microsoft Windows Server 2008 R2 SP1

Microsoft Office 2024 LTSC for Mac 16.104 VL / 2021 v16.84 / 2019 v16.53 / 2016 v16.17

Microsoft Office 2024 LTSC for Mac 16.104 VL / 2021 v16.84 / 2019 v16.53 / 2016 v16.17

آفیس برای مک

RDS - The Official Drift Videogame

RDS - The Official Drift Videogame

بهترین بازی دریفت برای کامپیوتر

MultiDrive 1.2

MultiDrive 1.2

کلون‌سازی و پشتیبان‌گیری دیسک

سخنرانی آیت الله محمد علی ناصری درباره نشانه های مؤمن در زیارت اربعین

سخنرانی آیت الله محمد علی ناصری درباره نشانه های مؤمن در زیارت اربعین

سخنرانی آیت الله ناصری درباره نشانه های مؤمن در زیارت اربعین

3D Bowling 2.9 for Android

3D Bowling 2.9 for Android

بولینگ سه بعدی

IHF Handball Challenge 14

IHF Handball Challenge 14

شبیه‌ساز رقابت‌های جهانی هندبال 2014

uTorrent Pro 8.2.20 for Android +4.0

uTorrent Pro 8.2.20 for Android +4.0

تورنت

Evernote 11.1.2.45930

Evernote 11.1.2.45930

نکته برداری ابری

سخنرانی حجت الاسلام پناهیان درمورد ولی فقیه

سخنرانی حجت الاسلام پناهیان درمورد ولی فقیه

سخنرانی حجت الاسلام پناهیان با موضوع منطق رهبری

Poppy Playtime (All 4 Chapters)

Poppy Playtime (All 4 Chapters)

پاپی پلی تایم

سخنرانی آیت الله وحید خراسانی با موضوع عظمت عید غدیر خُم

سخنرانی آیت الله وحید خراسانی با موضوع عظمت عید غدیر خُم

سخنرانی آیت الله وحید خراسانی با موضوع عظمت عید غدیر خُم

JetBrains WebStorm 2025.3.2 Win/Mac/Linux

JetBrains WebStorm 2025.3.2 Win/Mac/Linux

جت برینز وب استورم

A Tale of Momentum & Inertia

A Tale of Momentum & Inertia

انیمیشن کوتاه سه بعدی

سخنرانی حجت الاسلام انصاریان  با موضوع نگاه امام علی (علیه السلام) به دنیا- 2 جلسه

سخنرانی حجت الاسلام انصاریان با موضوع نگاه امام علی (علیه السلام) به دنیا- 2 جلسه

حاج آقا انصاریان با موضوع نگاه امام علی (ع) به دنیا

سخنرانی مسعود عالی با موضوع آرامش در زندگی - 6 جلسه

سخنرانی مسعود عالی با موضوع آرامش در زندگی - 6 جلسه

سخنرانی آرامش در زندگی با مسعود عالی

Mi Launcher 3.8.0 for Android +2.3

Mi Launcher 3.8.0 for Android +2.3

لانچر ساده و زیبای شرکت MiUi

Horizon Chase 2

Horizon Chase 2

ماشین مسابقه ای برای کامپیوتر

از چشمه تا دریا : مجموعه خاطرات درباره استاد شهید مرتضی مطهری

از چشمه تا دریا : مجموعه خاطرات درباره استاد شهید مرتضی مطهری

مجموعه خاطرات درباره استاد شهید مرتضی مطهری

PCI Geomatica 2018 SP2 Build 2019.06.04 / 2017 SP1 with Data build 12.09.2017

PCI Geomatica 2018 SP2 Build 2019.06.04 / 2017 SP1 with Data build 12.09.2017

پردازش تصاویر ماهواره ای و عکس های هوایی

Air Guardians

Air Guardians

نگهبانان هوایی

Vensim DSS 6.4E

Vensim DSS 6.4E

ون سیم

کدهای مخفی موبایل

کدهای مخفی موبایل

شگردها و ترفندهای موبایل

HTML Compiler 2026.1

HTML Compiler 2026.1

تبدیل صفحات وب به فایل‌های اجرایی

Pro Cycling Manager 2021

Pro Cycling Manager 2021

مدیریت دوچرخه سواری 2021

Batman Arkham Origins 1.3.0 for Android +4.0

Batman Arkham Origins 1.3.0 for Android +4.0

بازی بتمن برای تمام پردازنده های گرافیکی

دلیل شادی یا ناراحتی، موفقیت یا عدم موفقیت

دلیل شادی یا ناراحتی، موفقیت یا عدم موفقیت

راه های کسب موفقیت در زندگی

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!