Search results for "LLM"
10:27

EdgeX Labs, EdgeX Cloud'u resmi olarak duyurdu.

ChainCatcher mesajı, EdgeX Labs resmi olarak EdgeX Cloud'u tanıttı. EdgeX Cloud, AI Agent ve büyük dil modelleri için tasarlanmış bir GPU bulut bilişim platformudur. EdgeX Cloud, maliyet avantajı, düşük işletme maliyeti ve çoklu model desteği sağlamak üzerine odaklanmıştır, temel yetenekleri şunlardır: Önceden yapılandırılmış LLM ve Ajan çalışma ortamı; Otomatik esnek genişleme + Bulut ve kenar karmaşık hesaplama; İhtiyaca göre faturalandırma, hesap gücü israfını önler; Yerel/özel dağıtım, hassas senaryoları karşılar; Bu yayın, AI altyapısının daha hızlı, daha hafif ve daha erişilebilir hale geldiğini gösteriyor.
More
CLOUD7.61%
08:19

Gaia çekirdek geliştiricisi Harish Kotra, ETHDenver 2025 zirvesine katıldı ve açık kaynaklı LLM'ler hakkındaki görüşlerini paylaştı

Gaia, güvenli, sansüre dayanıklı ve para kazanılabilir AI proxy hizmetleri sağlamayı amaçlayan merkezi olmayan bir web projesidir. Çekirdek geliştiricisi Harish Kotra, ETHDenver 2025'te açık kaynaklı bir LLM çalıştırma konusunu paylaştı. GaiaNet, gizliliği korurken herkesin bilgi birikimini ve becerilerini birleştirmek için tasarlanmış, bireyler ve işletmeler tarafından kontrol edilen uç bilgi işlem düğümleri üzerine inşa edilmiştir.
More
EIGEN-1.11%
GAMES-2.77%
13:47

a16z ortağı: LLM türü ürünler, arama işinde bir devrimci potansiyele sahip olabilir.

a16z General Partner Andrew Chen, on social media, suggested that OpenAI's ChatGPT is astonishingly large and worth considering for commercial potential, while discussing issues such as per capita search frequency and single display revenue, performance after adopting advertising monetization, and so on. He believes that products with a user base similar to that of Firefox browser can generate annual revenue of nearly $1 billion at its peak, and if ChatGPT is free to use, monthly active users may increase significantly. At the same time, it pointed out that large language model (LLM) products have the potential to become disruptors in the search business.
More
  • 3
  • 1
06:23

Google, BharatGPT'nin geliştirilmesini desteklemek için Hintli startup CoRover.ai'a 4 milyon dolar yatırım yapmayı planlıyor

Webmaster House'a göre Google, BharatGPT'nin gelişimini desteklemek için Hintli startup CoRover.ai'a 4 milyon dolar yatırım yapmayı planlıyor. BharatGPT, 12'den fazla Hint dilini ve 120'den fazla yabancı dili destekleyen büyük dil modeli (LLM) tabanlı CoRover.ai yapay zeka çözümüdür. CoRover.ai, BharatGPT'nin %90 doğruluğa sahip olduğunu vurguluyor. Devasa bir internet veritabanına dayanan BharatGPT, içeriği esnek bir şekilde ayarlama ve geliştirme yeteneğine sahiptir. Bu uyarlanabilirlik, sistemin bölge, sektör, etki alanı, müşteri, işletme ve özel kullanım durumu gibi faktörlere dayalı olarak ilgili bağlamsal bilgileri entegre etmesini sağlayarak kullanıcıların soru sorarken güncel ve ilgili bilgilere sahip olmasını sağlar.
More
08:37
Webmaster House'a göre Google, BharatGPT'nin gelişimini desteklemek için Hintli startup CoRover.ai'a 4 milyon dolar yatırım yapmayı planlıyor. BharatGPT, 12'den fazla Hint dilini ve 120'den fazla yabancı dili destekleyen büyük dil modeli (LLM) tabanlı CoRover.ai yapay zeka çözümüdür. CoRover.ai, BharatGPT'nin %90 doğruluğa sahip olduğunu vurguluyor. Devasa bir internet veritabanına dayanan BharatGPT, içeriği esnek bir şekilde ayarlama ve geliştirme yeteneğine sahiptir. Bu uyarlanabilirlik, sistemin bölge, sektör, etki alanı, müşteri, işletme ve özel kullanım durumu gibi faktörlere dayalı olarak ilgili bağlamsal bilgileri entegre etmesini sağlayarak kullanıcıların soru sorarken güncel ve ilgili bilgilere sahip olmasını sağlar.
05:33
22 Kasım'da Inflection AI, Inflection-2 modelinin piyasaya sürüldüğünü resmen duyurdu ve modelin dünyanın ikinci nesil büyük dil modeli (LLM) olduğunu ve yalnızca OpenAI'nin GPT-4'ünden sonra ikinci olduğunu söyledi. Inflection AI, Inflection-2'nin FP5000 için ~100²⁵ FLOP ile 10 NVIDIA H8 GPU üzerinde eğitildiğini ve bu da onu Google'ın amiral gemisi PaLM 2 Large modeliyle aynı eğitim hesaplama kategorisine soktuğunu ve MMLU, TriviaQA, HellaSwag ve GSM8k gibi çoğu AI karşılaştırmasında PaLM 2'den daha iyi performans gösterdiğini söylüyor. Daha önce, Haziran ayında yapay zeka girişimi Inflection AI'nın Bill Gates ve Nvidia gibi yatırımcılarla 1,3 milyar dolar topladığı bildirilmişti.
05:33
22 Kasım'da Inflection AI, resmi olarak OpenAI'nin GPT-4'ünden sonra ikinci olduğu iddia edilen ve dünyanın ikinci nesil büyük dil modeli (LLM) olan Inflection-2'nin piyasaya sürüldüğünü duyurdu. Inflection AI, Inflection-2'nin ~10²⁵ FLOP ile 8 GPU üzerinde 8 karma hassasiyetli eğitim ile 5000 NVIDIA H100 GPU üzerinde eğitildiği anlamına gelir. Bu, onu Google'ın amiral gemisi PaLM 2 Large modeliyle aynı eğitim hesaplama kategorisine sokar ve MMLU, TriviaQA, HellaSwag ve GSM8k gibi çoğu AI karşılaştırmasında PaLM 2'den daha iyi performans gösterir. Daha önce, Haziran ayında yapay zeka girişimi Inflection AI'nın Bill Gates ve Nvidia gibi yatırımcılarla 1,3 milyar dolar topladığı bildirilmişti.
11:47
20 Kasım'da web yöneticisinin evinden gelen haberlere göre, Çin Bilim ve Teknoloji Üniversitesi Fengshen Listesi ve IDEA Araştırma Enstitüsü ekibi, Çin tıp alanında ChiMed-GPT adlı büyük bir dil modeli (LLM) geliştirmek için işbirliği yaptı. Model, Fengshenbang ekibinin Ziya2-13B modeli üzerine inşa edilmiştir, 13 milyar parametreye sahiptir ve çok çeşitli ön eğitim, denetimli ince ayar ve insan geri bildirimi ile pekiştirmeli öğrenme yoluyla tıbbi metin işleme ihtiyaçlarını karşılar.
IDEA7.62%
  • 1
14:24
Cardano'nun kurucusu Charles Hoskinson, OpenAI'nin (ChatGPT) yakın zamanda görevden alınan kurucusu Sam Altman'a Cardano'da merkezi olmayan bir büyük dil modeli (LLM) oluşturmak için işbirliği yapması için bir davet gönderdi.
06:29
İşlem hızını artırmak, bellek kullanımını ve iletişim maliyetlerini azaltmak için, Microsoft Azure ve Microsoft Research'ten bir araştırmacı ekibi, 10 Kasım'da IT Home tarafından bildirildiği üzere, büyük dil modeli (LLM) eğitimi için uyarlanmış verimli bir FP8 karma duyarlıklı çerçeve başlattı. Microsoft, dağıtılmış ve karma duyarlıklı eğitim için FP8'den yararlanan üç iyileştirme aşamasını kullanıma sunmuştur. Bu katmanlar ilerledikçe, FP8 entegrasyonundaki artış belirginleşir ve bu da LLM eğitim süreci üzerinde daha büyük bir etki olduğunu gösterir. Microsoft, yaygın olarak benimsenen BF16 karma duyarlık yaklaşımına kıyasla bellek ayak izinde yüzde 27 ila 42'lik bir azalma ve ağırlıklı gradyan iletişim yükünde yüzde 63 ila 65'lik önemli bir azalmayı test etti. Megatron-LM gibi yaygın olarak kullanılan BF16 çerçevelerinden %64 ve Nvidia Transformer Engine'den %17 daha hızlı çalışır. GPT-175B modelini eğitirken, hibrit FP8 hassas çerçevesi, H100 GPU platformunda bellekte %21 tasarruf sağlar ve TE'ye (Transformer Engine) kıyasla eğitim süresini %17 azaltır.
05:33

Amazon, çocukların yapay zeka destekli cihazlarla etkileşimli konuşmalar yapmasına olanak tanıyan Alexa ile Keşfet'i tanıttı

Amazon'un Echo cihazı artık Alexa ile Keşfet adlı yeni bir özellik aracılığıyla çocukların yapay zeka destekli Alexa ile etkileşimli konuşmalar yapmasına olanak tanıyacak. İlk olarak Eylül ayında duyurulan Amazon Kids+ içerik abonelikleri, çocukların Alexa ile üretken yapay zeka tarafından desteklenen ancak deneyimin güvenli ve uygun kalmasını sağlamak için tasarlanmış korumalı bir şekilde çocuk dostu konuşmalar yapmasına olanak tanır. Alexa ile yapılan geleneksel konuşmaların aksine, AI deneyimi iki yönlü bir yoldur. Yani, Alexa'ya sorular soran ve cevap alan sadece çocuklar değil. Alexa Kids'in kıdemli ürün müdürü Arjun Venkataswamy, çocukların Alexa ile konuşurken üretken yapay zekaya anında erişemediğini, içeriğin önceden incelendiğini ve yalnızca hayvan gerçeklerini ve kaynaklarını içeren küçük bir veri kümesinden geldiğini söyledi. Amazon ayrıca, bu yılın sonlarında aynı LLM yığınına dayanan yapay zeka tabanlı bir "Let's Chat" yetişkin Alexa deneyimi başlatmaya hazırlanıyor.
More
  • 1
  • 1
07:05
PRNewswire'a göre, 24 Ekim'de Moody's ve Google Cloud, Moody's müşterilerinin ve çalışanlarının yeni finansal içgörüler elde etmek ve finansal verileri daha hızlı özetlemek için yeni Büyük Dil Modeli'nden (LLM) yararlanmalarına yardımcı olmak için Moody's'in finansal analitik alanındaki uzmanlığını Google Cloud'un gelişmiş üretken yapay zeka teknolojisiyle birleştirmeyi keşfetmek için yeni bir stratejik ortaklık duyurdu. Spesifik olarak, ortaklık, finansal analitiği hızlandırmak için bir LLM oluşturmak da dahil olmak üzere üç temel hedefe dayanmaktadır; Finansal analizler için BigQuery'deki Moody's verilerine erişim sağlar; Finansal veriler için kurumsal aramayı geliştirin.
10:25
Son zamanlarda, Samsung Electronics'in bir yan kuruluşu olan Harman, IT House tarafından 17 Ekim'de bildirildiği üzere, tıp alanında üretken yapay zeka için büyüyen pazara girdi. Harman, doktorların, araştırmacıların ve kurumların gelişmiş hasta bakımı sunmalarını, tıbbi araştırmalar yapmalarını ve bilinçli kararlar almalarını sağlayan HealthGPT adlı üretken bir yapay zeka çözümü başlattıklarını söyledi. Şirket, HealthGPT'nin sorumlu yapay zeka ilkeleri üzerine inşa edildiğini, kapsamlı testlerden geçtiğini, otomatik bir LLM (Kişisel Dil Modeli) test çerçevesi kullandığını ve tıp uzmanları tarafından doğrulandığını söylüyor. Buna ek olarak, Kore'deki bazı şirketler de tıp alanı için üretken yapay zeka geliştirmede aktif olarak yer almaktadır. Örneğin, Kakao Brain, radyologlar için ön okuma raporları oluşturmak için büyük modeller ve üretken modeller kullanan bir AI CAD geliştirdi. Naver ayrıca daha önce, tıbbi bilgileri otomatik olarak tıbbi terimlere dönüştüren "Akıllı Anket", ses tanıma yoluyla tıbbi kayıtlar oluşturmak için "VOICE EMR", tıbbi kayıtları ve tıbbi muayene sonuçlarını sorgulamak ve analiz etmek için "Hasta Özeti" ve AI çağrı hizmetleri aracılığıyla kullanıcıları önemsemek için "Clova CareCall" dahil olmak üzere özellikle tıp alanı için çeşitli yapay zeka teknolojilerini tanıtmıştı.
08:48

BlackBerry, üretken bir yapay zeka destekli siber güvenlik asistanının piyasaya sürüldüğünü duyurdu

BlackBerry, Güvenlik Operasyonları Merkezi (SOC) ekipleri için CISO'ların operasyonlarını güçlendirmek için üretken yapay zeka tabanlı siber tehdit analizi ve desteği sağlayan yeni bir üretken yapay zeka asistanının piyasaya sürüldüğünü duyurdu. Doğruluğu ve veri gizliliğini artırmak için özel Büyük Dil Modellerinden (LLM) yararlanır. BlackBerry'nin Cylance AI müşterilerine sunulacak olan çözüm, müşteri ihtiyaçlarını öngörüyor, proaktif olarak bilgi sağlıyor ve araştırma süresini saniyelere sıkıştırıyor. Cylance'in sektörün ilk yapay zekalı ağ güvenliği çözümü ve sektörün ilk tahmine dayalı ağ güvenliği çözümü olduğu bildirildi.
More
  • 2
  • 1
08:11
7 Ekim tarihli bir Qubit raporuna göre, Stanford Üniversitesi ve diğer kurumlardan araştırmacılar yakın zamanda 3.096 Nature serisi makalesi ve 1.709 ICLR makalesinin insan geri bildirimi ve LLM geri bildirimlerini karşılaştırdı. Stanford akademisyenleri, GPT-4'ün Nature ve ICLR makaleleri hakkındaki inceleme görüşlerinin, insan incelemecilerin görüşlerine %50'den fazla benzer olduğunu keşfetti. Yazarların %82,4'ünden fazlası GPT-4 tarafından verilen görüşlerin oldukça faydalı olduğunu söyledi. Makalenin yazarı James Zou şu sonuca varmıştır: Hala yüksek kaliteli insan geri bildirimine ihtiyacımız var, ancak Yüksek Lisans, yazarların resmi hakem değerlendirmesinden önce makalenin ilk taslağını geliştirmelerine yardımcı olabilir. Bu çalışmaya Amerika Birleşik Devletleri'ndeki 110 yapay zeka kurumu ve hesaplamalı biyoloji kurumundan 308 araştırmacının katıldığı bildirildi.
  • 3
01:02
The Information'a atıfta bulunan konuya yakın bir kişi, Microsoft'un şirketin yapay zeka için tasarlanan ilk çipini önümüzdeki ay yıllık geliştirici konferansında piyasaya sürmeyi planladığını söyledi. Microsoft'un çipi, büyük dil modellerini (LLM) eğiten ve çalıştıran veri merkezi sunucuları için tasarlanmıştır. Microsoft'un veri merkezi sunucuları şu anda OpenAI ve Intuit dahil olmak üzere bulut müşterileri için gelişmiş LLM'yi desteklemek ve Microsoft'un üretkenlik uygulamalarındaki yapay zeka yeteneklerini desteklemek için Nvidia'nın GPU'larını kullanıyor.
  • 1
23:59
PANews, 7 Ekim'de Microsoft'un şirketin yapay zeka için tasarlanan ilk çipini önümüzdeki ay yıllık geliştirici konferansında piyasaya sürmeyi planladığını bildirdi. The Information'ın konuya aşina kaynaklardan alıntı yaptığı haberine göre. Yıllar süren çalışmanın sonucu olan bu hamle, Microsoft'un Nvidia tasarımı yapay zeka çiplerine olan bağımlılığını azaltmasına yardımcı olabilir. Talep arttıkça bu çiplerin arzı yetersiz kalıyor. Microsoft'un çipi, büyük dil modellerini (LLM) eğiten ve çalıştıran veri merkezi sunucuları için tasarlanmıştır. Microsoft'un veri merkezi sunucuları şu anda OpenAI ve Intuit dahil olmak üzere bulut müşterileri için gelişmiş LLM'yi desteklemek ve Microsoft üretkenlik uygulamalarındaki yapay zeka yeteneklerini desteklemek için Nvidia'nın GPU'larını kullanıyor.
  • 1
05:37
VentureBeat'e göre, 28 Eylül'de AI girişimi Cohere, diğer şirketlerdeki üçüncü taraf geliştiricilerin Cohere'in tescilli büyük dil modeli (LLM) Komutunu temel alan sohbet uygulamaları oluşturmasına olanak tanıyan yeni bir uygulama programlama arayüzünün (API) piyasaya sürüldüğünü duyurdu. Buna ek olarak Cohere, kullanıcıların chatbot'unu kendi başlarına test etmelerine olanak tanıyan kendi ücretsiz chatbot gösterimini (Coral Showcase) çevrimiçi olarak sunuyor. Coral'ın ilk olarak müşteriler için Coral chatbot'u Temmuz ayında başlattığı ancak API'nin müşterilerin bunu kendi dahili veya harici uygulamalarına yerleştirmesine olanak tanıdığı bildiriliyor. Cohere, RAG'ın sohbet API'sini desteklemenin yanı sıra, platformunun üçüncü taraf geliştiricilerin başlangıçtaki "belge modu", "sorgu oluşturma modu" ve "bağlayıcı modu" dahil olmak üzere üç modüler bileşenine bağlanmasına da olanak tanıdığını belirtti. Cohere, bu bağlayıcı/modül ekosistemini genişletmeyi planladığını kaydetti.
  • 2
06:36
IT House'un 29 Eylül tarihli haberine göre Microsoft, yakın zamanda geliştiricilerin büyük dil modellerine dayanan karmaşık uygulamalar oluşturmasına yardımcı olmak için AutoGen adında yeni bir araç yayınladı. Microsoft, bu tür karmaşık uygulamalar yaratan geliştiricilerin genellikle iş akışlarını tasarlama, uygulama ve optimize etme konusunda profesyonel bilgiye sahip olmaları gerektiğini söyledi.Bu sefer başlatılan AutoGen aracı, geliştiricilerin ilgili iş akışlarını otomatikleştirmesine, inşaat ve optimizasyon gibi süreçleri basitleştirip otomatikleştirmesine yardımcı olabilir. Microsoft, AutoGen'in aracı etkileşim davranışını tanımlamak için kullanılabileceğini söylüyor. Geliştiriciler, farklı uygulamalara yönelik esnek konuşma kalıpları yazmak için doğal dili ve bilgisayar kodunu kullanabilir. Geliştiriciler, birden fazla LLM aracısı arasındaki sohbetleri otomatikleştirerek, kod aracılığıyla araç kullanımı gerektiren görevler de dahil olmak üzere, insan geri bildirimlerine dayalı olarak görevleri kolayca bağımsız veya işbirliği içinde gerçekleştirmelerini sağlayabilir.
  • 2
05:36
Jiemian News'e göre Hongbo Pharmaceuticals, 28 Eylül'de etkileşimli platformda şirketin PR-GPT projesinin sorunsuz bir şekilde ilerlediğini ve büyük dil modellerinin (LLM), takip algoritması optimizasyonunun, en son biyomedikal veri eğitiminin ve uygulamasının yerel dağıtımından geçtiğini belirtti. senaryo geliştirme Diğer çalışmalar planlandığı gibi düzenli bir şekilde yürütülecek olup, demo fonksiyonunun yıl sonundan önce devreye alınması planlanmakta olup, 2024 yılının dördüncü çeyreğinde ön yetenekler oluşturularak pratik uygulamalara geçilecektir.
  • 2
14:23
IT House'un 27 Eylül tarihli haberine göre DeepMind araştırmacıları yakın zamanda büyük dil modellerinin (LLM) sıkıştırma yeteneklerini değerlendirdiklerinde, bu modellerin "sıkıştırma yeteneklerinin" oldukça şaşırtıcı olduğunu buldular. görüntüleri ve sesi sıkıştır İlgili İçerik ArXiv'de yayınlandı. DeepMind'ın araştırmasında "Chinchilla 70B" isimli bir model kullandığı aktarılıyor.Bu modelde ağırlıklı olarak metin eğitimi kullanılsa da araştırmacılar, modelin aynı zamanda dosyayı %43.3 oranında sıkıştırabilen ImageNet resimlerini sıkıştırmak için de kullanılabileceğini buldu. orijinal boyutu, hatta LibriSpeech konuşma örneklerini orijinalin %16,4'üne sıkıştırıyor. DeepMind'ın araştırması, modelin "tahmin etme" yeteneği ile "sıkıştırma" yeteneği arasında "eşdeğerlik" olduğunu kanıtlıyor, böylece araştırmacılar daha güçlü bir koşullu üretken model oluşturmak için herhangi bir sıkıştırma algoritmasını kullanabilirler. Çalışma ayrıca, eğer model sıkıştırma için kullanılacaksa, model ne kadar büyükse o kadar iyi olduğunu, aşırı büyük bir modelin sıkıştırma yetenekleri üzerinde olumsuz bir etkiye sahip olabileceğini de buldu.
02:24
MarkTechpost tarafından 16 Eylül'de hazırlanan bir rapora göre, Stanford Üniversitesi araştırmacıları, sanatsal fikirleri dönüştürme sürecini basitleştirmek için GPT-4 dil modelini kullanabilen, büyük dil modelleri (LLM) tarafından desteklenen yaratıcı bir kodlama ortamı olan Spellburst'un lansmanını duyurdu. kod. Spellburst'un farklı versiyonların birleştirilmesini de kolaylaştırarak sanatçıların farklı yinelemelerden unsurları birleştirmesine olanak tanıyabileceği bildiriliyor. Örneğin, araca "versiyon 4'teki çiçeğin rengini versiyon 9'daki vazonun şekliyle birleştirmesi" talimatını verebilirler. Spellburst'un ana güçlü yönlerinden biri, istem tabanlı keşif ve kod düzenleme arasında geçiş yapabilme yeteneğidir. Sanatçılar, ince ayarlı ince ayar kontrolüne olanak tanıyan temel kodu ortaya çıkarmak için oluşturulan görüntüye tıklamaları yeterlidir.
01:12
Jinshi'nin 16 Eylül tarihli haberine göre, Springer Nature'ın açık erişimli akademik dergisi "Scientific Reports" yakın zamanda yapay zeka (AI) üzerine bir araştırma makalesi yayınladı ve büyük dil modeli (LLM) AI konuşma robotunun yaratıcı düşünme görevlerinde çok etkili olduğunu belirtti. Deneklerin günlük eşyalar için alternatif kullanımlar bulmasını gerektiren bir görev (farklı düşünme örneği). Ancak çalışma aynı zamanda en yüksek puanı alan insan deneklerin hâlâ sohbet robotunun en iyi yanıtlarından daha iyi performans gösterebildiğini gösterdi.
01:07

Japonya, “ChatGPT”nin kendi Japonca versiyonunu oluşturuyor

The Paper'a göre Japonya kendi chatbot'u ChatGPT'yi geliştiriyor. "Nature" haberine göre Japon hükümeti, Japonca için büyük bir dil modeli (LLM) geliştirmek amacıyla yüz milyonlarca dolar yatırım yapmak üzere NEC, Fujitsu ve SoftBank gibi büyük teknoloji şirketleriyle iş birliği yaptı.
More
08:34
Science and Technology Innovation Board Daily tarafından 14 Eylül 2023 Küresel Yapay Zeka Çip Zirvesi'nde hazırlanan bir rapora göre, NVIDIA Çözüm ve Mimari Teknik Direktörü Zhang Ruihua, NVIDIA'nın en yeni açık kaynaklı yazılımı TensorRT-LLM'yi tanıttı. mevcut sorun. Zorluklar arasında hızlı model geliştirme, sık güncellemeler ve çok sayıda kullanıcı bulunmaktadır. Yazılım, GPU çoklu düğümlerini destekler ve programlanması kolaydır. Triton ile birleştirildiğinde, çok kullanıcılı gecikme sorunlarını azaltabilir, böylece tam olarak kullanılabilir. GPU ve maliyetlerin azaltılması. Büyük modellerin eğitimi için NVIDIA ayrıca, temelde büyük model eğitiminin tüm yaşam döngüsünü kapsayan, üretken yapay zeka modellerinin oluşturulması, özelleştirilmesi ve dağıtılmasına yönelik uçtan uca ve bulutta yerel bir eğitim çerçevesi olan NeMo Çerçevesini de önerdi. . Büyük modellerin anlamsız konuşmasını önlemek için NVIDIA ayrıca büyük modellerin bilgiyi daha iyi genelleştirmesine yardımcı olmak için bir güvenlik korkuluğu işlevi (Korkuluklar) sağlar. Zhang Ruihua, yapay zeka modellerinin çok büyük bir kullanıcı alanına sahip olduğuna inanıyor ve gelecekte bu modellerin yalnızca araştırma enstitülerinde var olmakla kalmayıp herkesin cep telefonlarında veya bilgisayarlarında da uygulamalar haline gelebileceğini düşünüyor.
  • 1
09:00
Babbitt News, 12 Eylül'de Xinzhiyuan, MLCommons'un bugün MLPerf v3.1 sürüm güncellemesini yayınladığını ve iki yeni kıyaslama eklediğini belirten bir makale yayınladı: LLM çıkarım testi MLPerf Inference v3.1 ve depolama performans testi MLPerf Storage v0 .5. Bunlar arasında, yeni piyasaya sürülen GH200 Grace Hopper süper çipi de MLPerf Inference 3.1'de ilk kez görücüye çıktı. Grace Hopper süper çipi, NVIDIA'nın Grace CPU'sunu ve H100 GPU'sunu ultra yüksek bant genişliği bağlantısıyla birleştirerek tek bir H100'ün diğer CPU'larla birleşiminden daha güçlü performans sağlar. Nvidia yapay zeka direktörü Dave Salvator bir basın toplantısında şunları söyledi: "Grace Hopper, H100 GPU sunumumuzla karşılaştırıldığında %17'lik bir performans artışıyla ilk kez çok güçlü bir performans sergiledi ve şimdiden öndeyiz. pano."
  • 1
07:54

Haizhi Technology, bilgi grafiği füzyonu büyük model uygulama platformunu başlattı

Geçtiğimiz günlerde Çin Mühendislik Akademisi akademisyeni, Tsinghua Üniversitesi Bilgisayar Bilimleri Bölümü profesörü ve Haizhi Technology baş bilim insanı Zheng Weimin, Çin Mühendislik Akademisi tarafından ortaklaşa geliştirilen "Atlas LLM Bilgi Grafiği ve Büyük Model Entegrasyon Uygulama Platformu"nu gösterdi ve yayınladı. Haizhi Teknolojisi ve Pekin'deki Yüksek Performanslı Grafik Hesaplama Akademisyen İş İstasyonu. Platform, B-son kullanıcılarının çoğunluğunu hedefliyor ve büyük modellerin kurumsal düzeydeki ve endüstriyel uygulamalardaki "illüzyonların" üstesinden gelmesine ve sektörlere ve senaryolara dayalı doğru çıkarımlar elde etmesine yardımcı olmak için temel bir yapay zeka teknolojisi olan bilgi grafiğini kullanıyor. Raporlara göre bu ürün enerji, finans, hükümet işleri ve diğer alanlardaki senaryolarda konuşlandırılıp uygulanarak genel yapay zekanın "son kilometresini" B tarafı ve endüstriyel uygulamalara açmaya çalışıyor.
More
  • 1
01:31
IT House'a göre, Güney Kore'nin Electronic Daily gazetesine atıfta bulunan Samsung Electronics, Samsung'un dahili çalışmalarına yardımcı olacak bir yapay zeka sohbet robotu oluşturmak için Microsoft'un Azure OpenAI hizmetini kullanıyor. Samsung'un Microsoft ile "dahili üretken yapay zeka geliştirme" üzerinde çalıştığı aktarılıyor. Bu planda yer alan yapay zeka, çeviri ve belge özetleme gibi görevleri yerine getirebilecek ve "GPT-4" ve "GPT-4" kullanacak. OpenAI tarafından geliştirilen GPT-3.5” LLM'nin tamamlanmasına yönelik proje şu anda konsept kanıtlama (PoC) aşamasındadır.
11:43
Ekonomik Referans Ağı'nın 11 Eylül tarihli bir raporuna göre, Çin Mühendislik Akademisi akademisyeni, Tsinghua Üniversitesi Bilgisayar Bilimleri Bölümü profesörü ve Haizhi Technology'nin baş bilim insanı Zheng Weimin, " Atlas LLM", Haizhi Technology ve Pekin'deki yüksek performanslı grafik hesaplama akademisyeni iş istasyonları tarafından ortaklaşa geliştirilmiştir. Bilgi grafiği ve büyük model entegrasyonu uygulama platformu." Platform, B-son kullanıcılarının çoğunluğunu hedefliyor ve büyük modellerin kurumsal düzeydeki ve endüstriyel uygulamalardaki "illüzyonların" üstesinden gelmesine ve sektörlere ve senaryolara dayalı doğru çıkarımlar elde etmesine yardımcı olmak için temel bir yapay zeka teknolojisi olan bilgi grafiğini kullanıyor. Raporlara göre bu ürün enerji, finans, hükümet işleri ve diğer alanlardaki senaryolarda konuşlandırılıp uygulanarak genel yapay zekanın "son kilometresini" B tarafı ve endüstriyel uygulamalara açmaya çalışıyor.
04:00
1. NVIDIA, H100 çıkarım performansını 8 kata kadar artırabilen TensorRT-LLM'yi piyasaya sürdü 2. Microsoft, kanseri tanımlamak ve tespit etmek için dünyanın en büyük görüntü tabanlı yapay zeka modelini oluşturmak üzere Paige ile işbirliği yapıyor 3. G20 üye ülkeleri kripto düzenlemesini onaylıyor İlgili riskleri azaltmak için varlıklar Düzenleyici yol haritası 4 Ekim'de tartışılacak. Roblox'un bu yılın Ekim ayında Sony PlayStation platformunda piyasaya sürmeyi planladığı metaveri platformu 5. Ant Group Başkan Yardımcısı Wang Xiaohang: Finans alanındaki tüm önemli bağlantılar değerli büyük model teknolojisiyle dönüşümün
01:19
IT House tarafından 9 Eylül'de hazırlanan bir rapora göre NVIDIA kısa süre önce, Hopper gibi AI GPU'lar üzerindeki tüm büyük dil modellerinin çıkarım performansını hızlandırabilen derinlemesine optimize edilmiş bir açık kaynak kitaplığı olan TensorRT-LLM'nin piyasaya sürüldüğünü duyurdu. NVIDIA şu anda GPT-3 (175B), Llama Falcom (180B) ve Bloom modellerini hızlandırabilen GPU'sunu optimize etmek amacıyla AI çekirdeklerini uygulamak için SmoothQuant, FlashAttention ve fMHA gibi en son teknolojileri kullanmak üzere açık kaynak topluluğuyla birlikte çalışıyor. TensorRT-LLM'nin öne çıkan özelliği, uçuş sırasında toplu işlem adı verilen ve işin diğer görevlerden bağımsız olarak GPU'ya girip çıkmasına olanak tanıyan bir planlama şemasının sunulmasıdır. Bu çözüm, aynı GPU'nun yoğun bilgi işlem gerektiren büyük istekleri işlerken birden çok küçük sorguyu dinamik olarak işlemesine olanak tanır, GPU'nun işlem performansını artırır ve H100'ün verimini 2 kat hızlandırır. Performans testinde NVIDIA A100'ü temel olarak kullandı ve H100 ile H100'ü TensorRT-LLM etkinken karşılaştırdı. GPT-J 6B çıkarımında H100'ün çıkarım performansı A100'ünkinden 4 kat daha yüksek olurken, H100'ün TensorRT ile performansı -LLM etkinken A100'den 8 kat daha iyiydi.
23:38
PANews, 9 Eylül'de resmi haberlere göre NFT kredi anlaşması ParaSpace'in ParaX teknik incelemesini yayınladığını bildirdi. ParaX ekosistemi, hesap soyutlamayı, meta kullanıcı arayüzünü, zkVM'yi ve etki alanları arası amaç tabanlı LLM'yi kapsayan mevcut ParaSpace ve Paralel ürünleri üzerine kurulmuştur. ParaX, otomatikleştirilmiş, akıllı bir yürütme katmanı sunarak kullanıcının Web3 uygulamalarıyla etkileşimini basitleştirmeyi amaçlamaktadır.
20:37
Jinse Finance, NFT borç verme protokolü ParaSpace'in ParaX teknik incelemesini yayınladığını bildirdi; ParaX, web3 uygulamalarıyla etkileşimi basitleştirmek için tasarlanmış zincirler arası yapay zeka odaklı bir ekosistemdir. ParaX ekosistemi, hesap soyutlama, meta-UI, zkVM, alanlar arası amaç tabanlı LLM ve daha fazlasını kapsayan mevcut ParaSpace ve Paralel ürünleri üzerine kuruludur.
  • 2
  • 1
10:30
Odaily Planet Daily, FaTPay tarafından yatırım yapılan bir yapay zeka projesi olan reAI.chat'in, GPT-3.5 ve kısa süre önce başlatılan GPT-4 de dahil olmak üzere LLM hata ayıklama ipuçlarına yardımcı olmak için tasarlanmış yeni bir araç _er'i başlattığını bildirdi. GPT-3.5/GPT-4 gibi büyük dil modelleri için etkili ipuçları geliştirirken doğru araçlara sahip olmak önemlidir. OpenAI Playground ve reAI.chat tarafından geliştirilen _er, bu süreci daha kolay ve daha verimli hale getirmek için tasarlanmış özellikler sunuyor. _er'in temel özellikleri şunlardır: -Basit ve sezgisel kullanıcı arayüzü: Testi hızlı ve kolay hale getirir, karmaşık arayüzlerle zaman kaybetmenize gerek kalmaz. - Özelleştirilebilir parametreler: Kullanıcılar, modelin tepkisini doğrudan şekillendirmek için sıcaklık, üst-p vb. gibi parametrelere ince ayar yapabilir ve özelleştirme yeteneğini geliştirebilir. - İstem Geçmişi: Geçmiş istemleri referans olarak kaydetme ve geri yükleme yeteneği, istemleri test ederken harcanan zamanı ve çabayı azaltır. -Toplu test işlevi: aynı anda birden fazla istemin test edilmesine olanak tanır ve yineleme aşamasının süresini büyük ölçüde azaltır. - Özel uç noktalar: Resmi OpenAI API'sine ek olarak kullanıcılar kendi API uç noktalarını kullanabilirler. Bu esneklik, ileri düzey kullanıcılar veya özel gereksinimleri olan kullanıcılar için verimli alet etkileşimini kolaylaştırır. -Hafif ve kurulum gerektirmez: _er, tamamen tarayıcıda çalışan, kurulum veya indirme gerektirmeyen hafif bir araçtır.
09:43
Babbitt News, 5 Eylül'de Alibaba Cloud, AI model topluluğu ModelScope'un, açık kaynaklı büyük dil modeline (LLM) uyarlanan AI Agent geliştirme çerçevesi ModelScope-Agent'ı başlattığını duyurdu. ModelScope-Agent ile tüm geliştiriciler, açık kaynaklı LLM'ye dayalı olarak kendi aracı uygulamalarını oluşturabilir, hayal gücünü ve yaratıcılığı maksimum düzeye çıkarabilir. Şu anda ModelScope-Agent kodu açık kaynaktır.
03:14
Webmaster's Home'un 29 Ağustos tarihli bir raporuna göre, Indianapolis merkezli startup ConverSight, A Serisi finansmandan 9 milyon dolar aldığını ve şirketlere daha iyi ve daha hızlı veri analizi sağlamak için üretken yapay zekayı kullanmaya kararlı olduğunu duyurdu. Şirket, yeni fonları pazara açılma çabalarını artırmak ve tekliflerini "MarketSpace" olarak adlandırdığı yeni özelliklerle genişletmek için kullanacağını söyledi. ConverSight bugüne kadar 15 milyon dolardan fazla bağış topladı ve birçok veri altyapısı tedarikçisi ekiplerin verilerini kontrol etmesini, erişmesini ve yapılandırmasını kolaylaştırmak için yapay zeka büyük dil modellerini (LLM'ler) kullanmaya çalıştığı için yeni finansman kritik bir zamanda geliyor.
  • 1
Load More
Hot Tags

Hot Topics

More

Crypto Calendar

More
Major Etkinlikler
Linea, 10 Eylül'de TGE'ye başlayacak ve Airdrop başvuru penceresi 10 Eylül'den 9 Aralık'a kadar açık olacaktır. LINEA'nın toplam arzının %85'i ekosisteme tahsis edilmiştir; bunun %10'u erken kullanıcılar ve geliştiricilere, %75'i ekosistem fonuna gitmektedir. Takım veya VC tahsisi yoktur ve tüm Airdrop Token'ları tamamen kilidi açılmıştır.
2025-09-10
Hackathon
Theta Network, 7-11 Eylül tarihleri arasında Berlin'de düzenlenecek ThetaEuroCon sırasında BlockJam Hackathon'u düzenleyecek. AI ve blockchain inovasyonuna odaklanan etkinlik, 150.000 $'ın üzerinde ödül ve fonlama sunuyor. AI veya blockchain alanında çalışan geliştiricilerin başvurması teşvik edilmektedir. Seçilen en iyi katılımcılar, TEC tarafından karşılanan ücretsiz konferans geçiş belgeleri ve otel konaklaması alacak. Başvurular theta-euro.com/block-jam adresinden açık.
2025-09-10
11.31MM Token Kilidi Açma
Aptos, tokenleri UTC ile 10:00'da kilidini açar.
2025-09-10
Hackathon
Chiliz, Ethereum Brasil ve São Paulo FC iş birliğiyle Hacking Tricolor hackathon'unu başlattı. Etkinlik 3-11 Eylül tarihleri arasında çevrimiçi ve yüz yüze formatlarda gerçekleştirilecek. Katılımcılar SPFC token'ı ile güçlendirilmiş fan jetonu hizmetleri ve DeFi uygulamaları geliştirecekler. Final aşaması 10-11 Eylül tarihlerinde Morumbi Stadyumu'nda gerçekleştirilecek.
2025-09-10
MiAssets Otomatik Göçü Sona Erdi
Mitosis, Teşvikli Göç Dönemi'ni tamamladı. Dış zincirlerde kalan Expedition miAssets, otomatik olarak Mitosis ana ağına göç edecek. Otomatik göç süreci 11 Eylül'de 00:00 UTC'de sona erecek.
2025-09-10
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)