Список форумов neuroproject.ru neuroproject.ru
Форум сайта компании НейроПроект
 
 FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 

Прогнозирование продаж по номенклатуре и количеству.

 
Начать новую тему   Ответить на тему    Список форумов neuroproject.ru -> Прогнозирование
Предыдущая тема :: Следующая тема  
Автор Сообщение
AllGrit
Новый посетитель
Новый посетитель


Зарегистрирован: 27 Апр 2008
Сообщения: 5

СообщениеДобавлено: Пн Янв 12, 2009 10:02 pm    Заголовок сообщения: Прогнозирование продаж по номенклатуре и количеству. Ответить с цитатой

Здравствуйте.

Передо мной стоит задача прогнозирования продаж продовольственного магазина на некоторый период. Имеющиеся данные представляют собой чеки за 2,5 года. После обработки всего списка, было выделено 20 категорий номенклатуры, которые я полагаю использовать как входы, также полагаю включить во входную информацию температуру в данном регионе. Выходная информация, которой бы хотелось обладать- продажи на следующий день. Кодирование 20 категорий планирую осуществлять методом единички на входе, нулей на остальных входах. Однако, у меня есть некоторые другие соображения по этому поводу.

Возможно ли это? Входную информацию разбить по дням. Каждый вход будет означать число продаж товаров той или иной категории от 0 до 1. 0.5 - средние продажи, 0.7 - высокие и т.д. Таким образом закодировать информацию о целом дне, включить температуру за день, и таким образом получить 21 входной нейрон. На выходе соответственно 20 нейронов, которые отображают число продаж по категориям, аналогично входу. Насколько сообразно такое решение?

Либо стоит использовать подход с единицей и тогда число входов будет равно число категорий помноженное на размер окна. Если я правильно понимаю. Получается очень много...Но, тогда, число связей резко возрастает, и как мне кажется, не хватит примеров для корректного обучения.

Есть еще вопрос по поводу выбора сети. Если это МП, то количество нейронов в скрытом слое, по самым грубым оценкам, должно составлять на порядок больше, нежели, чем число нейронов входной информации. Обучение такой сети требует большого количества элементов в обучающей выборке. И как мне кажется, данных за 2,5 года будет явно не достаточно? Что касается радиально-базисной структуры сети, то как будет выглядеть хотя бы примерное число нейронов для такой сети с таким числом входов?

И еще небольшой вопрос по поводу снятия сезонности. Как я полагаю, если не использовать сеть с обратными связями, то она далекое прошлое будет мало учитываться в прогнозе следующего дня. Стоит ли сначала выполнять категоризацию по сезону, а потом лишь только выполнять прогнозирование. Либо сезонность будет учитываться при выборе адекватной модели. Если да, то какую модель стоит использовать?

Большое спасибо за уделенное время, понимаю, что вопросов стоит крайне много, буду рад полчить ответы хотя бы на некоторые из них.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
siteadmin
НейроПроект
НейроПроект


Зарегистрирован: 10 Июн 2005
Сообщения: 80
Откуда: Москва

СообщениеДобавлено: Вс Янв 18, 2009 3:38 am    Заголовок сообщения: Ответить с цитатой

ну для начала стоит подумать, а не подойдут ли другие методы прогнозирования (например,статистические).
во-вторых, вопрос что подавать на вход и что на выходе - вы уверены что для прогнозирования продаж по отдельной категории вам на вход надо подавать данные по всем другим категориям? может, достаточно данных только по этой категории.
Для учета сезонности можно с помощью фильтров разделить сигнал на несколько компонент (например: тренд, сезон, недельные(месячные) колебания, остаток) , попробывать по-отдельности их прогнозировать, а потом просуммировать.
Кстати,наверняка есть фактор выходных дней-праздников. можно попробывать его закодировать отдельным входом
Вообще, чтобы чтото говорить, надо видеть данные. 2.5 года - это, конечно, не много данных, но в принципе может и достаточно.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
AllGrit
Новый посетитель
Новый посетитель


Зарегистрирован: 27 Апр 2008
Сообщения: 5

СообщениеДобавлено: Вс Янв 18, 2009 4:21 am    Заголовок сообщения: Ответить с цитатой

Большое спасибо за ответ. Что касается статистических методов - то тут стоит не цель решить задачу, а исследовать возможность применения нейронных сетей в прогнозировании. Мне кажется данных по одной категории недостаточно. По крайней мере, я составлю сначала корреляционную матрицу, а там посмотрим что стоит отбросить. На несколько компонент я думал делить, если не получится сырой ряд прогнозировать. Как фактор праздников кодировать не представляю, если продажи идут рядом недельным или месячным, хотя... Если правильно полагаю, в недельном случае достаточно подавать на вход 1 если праздник есть, а в месячном, например, 0.3 , 0.6, 1 в зависимости от числа праздников. Или есть более надежный способ кодирования?

Вот как выглядят данные. Таблица 1.
ChDtTmNum(дата числом) ChDtTmDate ChekNr(номер чека) FullName(полное наименование) ShortName(сокращенное) Qnt(кол-во) CCost(цена)

38729,82361 12.01.2006 19:46 2006006384 Детский крем 40г "Алиса" Детский 1 13,6

38729,82361 12.01.2006 19:46 2006006384 Колбаса 1кг "Молочная" вар. в/с Колбаса 0,366 62,22

38729,82361 12.01.2006 19:46 2006006384 Молоко 1л "М" 3,2% лианозовское Молоко 1 22,8

38729,82361 12.01.2006 19:46 2006006384 Сметана 400г "Буренка" 30% Сметана 1 27,5

38729,82361 12.01.2006 19:46 2006006384 Сырок 45г ДАНОН ваниль Сырок 1 6,5

38729,82361 12.01.2006 19:46 2006006384 Яблоки 1кг Крупные Яблоки 0,256 9,73

38729,82431 12.01.2006 19:47 2006006385 Батон 330г "Черкасский" Батон 1 8

Таблица 2.
№ ShortName FullQnt Category(категория) CNum
1 Фруктовый 104 Мороженое 1
2 Мороженое 212 Мороженое 1
3 Рожок 211 Мороженое 1
4 СтаканМороженое 42 Мороженое 1
5 Брикет 101 Мороженое 1
6 Эскимо 73 Мороженое 1
7 Пломбир 60 Мороженое 1
8 Трубочка 38 Мороженое 1
9 Лоток 32 Мороженое 1
10 Торт-мороженое 17 Мороженое 1
11 Ваф/стакан 17 Мороженое 1
12 Лакомка 12 Мороженое 1
13 Стаканчик 15 Мороженое 1
....
27 Мелочь 63 Хлебо-булочные 2
28 Сдоба 55 Хлебо-булочные 2
29 Фаготтини 49 Хлебо-булочные 2
30 Пряник 45 Хлебо-булочные 2
31 Сушки 44 Хлебо-булочные 2
32 Круассан 30 Хлебо-булочные 2
33 Лепешка 35 Хлебо-булочные 2
34 Печ, Печ. 34 Хлебо-булочные 2

Спасибо за уделенное время и помощь.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
siteadmin
НейроПроект
НейроПроект


Зарегистрирован: 10 Июн 2005
Сообщения: 80
Откуда: Москва

СообщениеДобавлено: Пн Янв 19, 2009 2:57 am    Заголовок сообщения: Ответить с цитатой

Цитата:
Мне кажется данных по одной категории недостаточно. По крайней мере, я составлю сначала корреляционную матрицу, а там посмотрим что стоит отбросить.

2,5 года = 132 недели. 132 недельные точки, 2 полных годовых цикла... можно пробывать. хотя, не увидев графика, сложно чтото сказать. Корреляционную матрицу, безусловно, рассчитать очень полезно. не исключено, что между продуктами может быть какая-то взаимозаисимость (например, "каннибализация", когда увеличение продаж одного продукта происходит за счет уменьшения другого).
Цитата:
Как фактор праздников кодировать не представляю, если продажи идут рядом недельным или месячным, хотя... Если правильно полагаю, в недельном случае достаточно подавать на вход 1 если праздник есть, а в месячном, например, 0.3 , 0.6, 1 в зависимости от числа праздников. Или есть более надежный способ кодирования?

ну варианты могут быть разные - например, доля праздниченых дней. Хотя, опять же, влияние праздников еще надо исследовать. А кодировать надо так, как будет лучше получаться...
Вообще, тут скорее важно понимание бизнеса, лично я, как человек, не имеющий никакого отношения к продуктовому ритейлу, кроме как периодические походы за едой в магазин, могу предположить, что в выходные и праздники все-таки продажи должны быть выше.

По поводу примеров - я имел в виду, что смотреть надо не на отдельные чеки, а на временные ряды продаж во времени. чеки могли бы помочь выявлять группы продуктов, которые продаются вместе, но это совершенно другая задача.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов neuroproject.ru -> Прогнозирование Часовой пояс: GMT + 4
Страница 1 из 1

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Rambler's Top100 Rambler's Top100