d16 - neon или vfpv3 - PC - Hola(Duo) - Форум

Контакты

E-mail: info@starterkit.ru
тел.: +7 922 680-21-73
тел.: +7 922 680-21-74
Телеграм: t.me/starterkit_ru

Партнеры:

otladka.com.ua - г.Киев

Способы оплаты

Новости

Выпуск SK-A40i

Выпуск SK-A40i-NANO/-2E

Выпуск ES-T113-NANO

Выпуск SK-A40i-SODIMM

Выпуск SK-NUC906-NANO

Участие в Экспоэлектроник…

Выпуск SK-STM32H743

Выпуск SK-iMX8Mini-CAN-Pl…

Выпуск SK-iMX8Mini-Artix-…

Выпуск SK-XC6SLX9-MB-SODI…

Выпуск SK-iMX6ULL-NANO-2E

Выпуск SK-PLC-NANO-MB

Выпуск SK-iMX8Mini-SODIMM

Выпуск SK-iMX8Mini-MB-LCD

Выпуск SK-iMX8Mini-MOD

User Info

Добро пожаловать,
Guest

	Регистрация или вход
	Потеряли пароль?

Ник:
Пароль:

	Пользователей:	0
	Поисковых ботов:	3
	Гостей:	1

Всего:

Форум » starterkit.ru » Отладочные платы » Hola(Duo)-PC

neon или vfpv3-d16

danilsl

25.05.2014 17:54 Редактировалось

25.05.2014 18:03

Сообщение: 1

Пункты: 4194

Регистрация: 08.12.2010

Пол: Мужчина

В mainfs из виртуальной машины от холы дуо в качестве floating point strategy стоит vfpv3-d16. Я много читал об этих ускорителях, даже свои опыты ставил, собирая тестовые проги либо с тем либо с тем ускорителем. И ни собственные тесты, ни какие либо источники из интернет не показали хоть какого-то превосходства vfp над neon ни на 8-х, ни на 9-х кортексах. Вот мне и интересно, я что-то пропустил, или эта настройка основанна на личных предпочтениях? Кстати thumb2 даёт некоторую экономию размеров бинарников, но за счёт снижения производительности на 5-10%. И на любых компиляторах кроме linaro в режиме thumb2 принципиально не собирается php. А вот сам linaro довольно спорный компромис. С codesourcery лично у меня проблем было на порядок меньше. А использовать linaro вынуждает сам фрискейл: вивантовские либы которые лежат у них на сайте ни фига не работают... Я даже ltib собирал, подсунув патч для холы, большая часть видосов или вообще не воспроизводится или наглухо вешает плату на 2-3 минуте просмотра.
Так что не воспримите этот пост как наезд, я всего лишь хочу знать обоснование, почему используется более медленный vfpv3-d16

sasamy

25.05.2014 22:36 Редактировалось

25.05.2014 22:37

Сообщение: 2

Пункты: 77331

Регистрация: 14.08.2009

Цитата

Вот мне и интересно, я что-то пропустил, или эта настройка основанна на личных предпочтениях?

не знаю какие ваши предпочтения, а майнстрим - vfpv3-d16

https://wiki.debian.org/ArmHardFloatPort#Minimum_CPU_.26_FPU

Цитата

Кстати thumb2 даёт некоторую экономию размеров бинарников, но за счёт снижения производительности на 5-10%.

какие-то тесты поддтверждающие ваши слова есть ?

Цитата

А вот сам linaro довольно спорный компромис. С codesourcery лично у меня проблем было на порядок меньше.

вы для начала прочитайте про то чем пользуетесь

http://e2e.ti.com/support/embedded/linux/f/354/p/329715/1150828.aspx#1150828

danilsl

25.05.2014 23:03 Редактировалось

25.05.2014 23:09

Сообщение: 3

Пункты: 4194

Регистрация: 08.12.2010

Пол: Мужчина

Насчёт thumb2 гдето на хабре вычитал, сходу не нашёл.
А по второй части, ну допустим в codesourcery действительно нет оптимизации. Но тогда мне интересно, почему тот же ti в хвост и гриву эксплуатирует codesourcery lite? Использовать linaro им религия чтоли не позволяет? Или там толпа дибилов собралась? Кстати они же упорно продвигают именно neon. А когда nvidia на второй тегре пошла по мейнстриму, что-то её загнобили...
Единственное но: я не щупал их камней кроме cortex-a8. Так что не судите строго... Я не придираюсь, не выпендриваюсь, я всего-лишь хочу подобрать оптимальный вариант для холы.

sasamy

26.05.2014 00:03 Редактировалось

26.05.2014 09:10

Сообщение: 4

Пункты: 77331

Регистрация: 14.08.2009

Цитата

Насчёт thumb2 гдето на хабре вычитал

лично я больше доверяю инженерам Linaro - в их сборках thumb2 по умолчанию

Цитата

Но тогда мне интересно, почему тот же ti в хвост и гриву эксплуатирует codesourcery lite?

ну они ядро 2.6.37 активно эксплуатируют - о чем это вообще может говорить ?

Цитата

Единственное но: я не щупал их камней кроме cortex-a8.

NEON в качестве FPU дает выигрыш как раз только на a8 - у него VFP Lite без конвеера, только NEON на кортексах a8/9 не поддерживает двойную точность, при этом GCC для ARM в принципе не способен выполнять автовекторизацию, так что не знаю где вы мифов начитались

Цитата

я всего-лишь хочу подобрать оптимальный вариант для холы

на мультимедийных процессорах ARM играет вспомогательную роль, я лично не заметил никаких улучшений производительности когда собирал с -mfpu=neon -O3, а вот проблемы со стабильностью проявились через пару минут использования.

UPD "NEON на кортексах a8/9 не поддерживает двойную точность" - это некорректно, a8 не поддерживает, a9 - поддерживает, только без SIMD

Цитата

The Cortex-A9 NEON MPE features are:

SIMD and scalar single-precision floating-point computation

scalar double-precision floating-point computation

danilsl

26.05.2014 13:23

Сообщение: 5

Пункты: 4194

Регистрация: 08.12.2010

Пол: Мужчина

В принципе двойную точность я не учёл, поэтому наверное vfp всё-таки будет правильнее. А те кому такая точность не нужна в конфиге бьюлдрута переопределяют опции как им нужно, к примеру opencv нагло втыкает -mfpu=neon -ffast-math, а бьюлдрут, видя что -mfpu уже задана, vfp не подсовывает...

Форум » starterkit.ru » Отладочные платы » Hola(Duo)-PC

Темы	Автор	От.	Пр.	Последний
buildroot MangoPi T113-S3, не монтируется USB Flas…	dolmatov	0	42	dolmatov
В терминале вижу иероглифы	mrshcherbinin	8	195	sasamy
настройки порта LVDS1	Mikchel	5	127	Mikchel
Ищу отладочную плату SK-MLPC2478	МилТех	0	86	МилТех
Отключение задержки U-Boot	aabogomolov	2	281	aabogomolov
Проблема установки драйвера WinUSB4NuVCOM.	VetalGerq	4	148	VetalGerq
помогите новичку	mrshcherbinin	2	671	mrshcherbinin
Сборка Debian 12.5 "bookworm" для SK-A40…	Perevezentsev	8	534	Perevezentsev
прошивка модуля через USB флэшку	Kamil_ufa	1	144	sasamy
UART: крик души	incredi	4	205	sasamy
Настройка systemd на buildroot	Kamil_ufa	1	164	sasamy
Работа UART в режиме полудуплекса	incredi	5	223	incredi
Назначение LED для ethernet	Kamil_ufa	2	166	yided
Настройка spi	Kamil_ufa	11	362	Kamil_ufa
buildroot-2017.08 на базе ядра 4.1.15-2.1.0 для i.…	sasamy	67	28001	sasamy

Навигация

Контакты

Способы оплаты

Новости

User Info